RessourcesOutilsFroids – ArticleVeilleMag
Ci-dessous un article que j’ai rédigé pour Veille Magazine de Janvier 2006:
2006, année charnière pour les moteurs de recherche
dentreprise ?
Lannée
a
stratégiques importantes dans le secteur des moteurs de recherche dentreprise et
pourrait bien être considérée comme un tournant pour ce marché jusque là plutôt
ronronnant.
Lannonce du rachat en novembre dernier de Verity par
Autonomy pour un montant de 500 millions de dollars a bien sûr été le point
culminant de ces mouvements, mais dautres avaient précédemment laissé
entrevoir un frémissement du marché. Ainsi Verity a racheté en juin dernier 80-20,
une solution de « desktop search » lui permettant détendre sa gamme.
IBM pour sa part a multiplié les annonces avec le lancement dOmnifind et la
mise à disposition en Open Source dUIMA (Unstructured Information Management
Architecture), une plateforme globale de traitement de données non-structurée.
Plus récemment, Big Blue a annoncé des accords avec X1 et Google autour de
solutions de « desktop search », ainsi que le rachat de la société iPhrase
en décembre dernier. Pour finir
a
moteur statistique Matchpoint, par Oracle, ainsi que larrivée remarquée du
français Exalead sur le marché américain.
Autonomy-Verity, le
signal dune restructuration du marché ?
Difficile donc de nier leffervescence autour des moteurs de
recherche dentreprise, dautant que comme le précise Susan Feldman,
vice-présidente de la recherche sur les technologies de contenu chez IDC :
« Il y a eu près dune centaine de fusions ou acquisitions sur le marché
de la gestion de contenu (recherche, gestion des « assets »
numériques, records management) dans les 3 – 4 dernières années ». Doit-on pour autant voir dans ces mouvements le
signal dune consolidation générale ?
Cest que ce marché est plutôt paradoxal. Malgré une
croissance du secteur estimée par IDC à 25% par an les sociétés dégagent des
chiffres daffaire bien moins importants que ceux de la plupart des autres
secteurs de lindustrie informatique. Et encore faut-il prendre en compte la
part importante des activités de conseil et dintégration dans les résultats de
ces sociétés. Le rapport annuel de Verity montre par exemple que la vente de
logiciel en
généré 80 millions de $ dont plus de 60% en conseil. Cette compétence serait
dailleurs une des raisons principales de son rachat par Autonomy.
On explique généralement ces faibles résultats par un morcellement
des acteurs créant un manque de visibilité et entraînant la frilosité des
investisseurs. Une tendance que lopération Autonomy-Verity pourrait modifier selon
lavis de Martin White, rédacteur de lEnterprise Search Guidebook 2005: Je ne
vois pas dautres contrats du type Autonomy-Verity se profiler explique t-il,
parce que tout le monde va attendre de voir ce qui se passe pour ces deux-là
mais je pense quon va assister à une arrivée plus importante dinvestisseurs
car cette acquisition a valorisé ce marché ».
Le site CMS Watch, éditeur le l« Enterprise Search
Report », en donne une vision qui, à défaut dêtre dynamique, présente une
segmentation claire (voir tableau n° 1)
Les « Big Three » |
Acteurs « traditionnels » |
Autonomy-Verity Convera Fast Search & Transfer |
Editeurs à forte spécialisation |
Se concentrent sur les besoins spécifiques de certains |
Endeca Inquira iPhrase Lextek Stratify Teratext |
Vendeurs dinfrastructures et de solutions de gestion de |
Recherche présentée comme élément dune plateforme de |
Hummingbird IBM Microsoft Opentext Oracle SAP |
Challengers de milieu de gamme |
Offrent des moteurs de recherche assez complets pour des |
Arikus Copernic (Mamma) Isysusa Speedofmind |
« Search appliances » |
Boîtiers « plug and play » de plus en plus |
Thunderstone |
Services hébergées |
Service en mode ASP, plutôt adapté aux fichiers HTML |
Atomz Blossom Crownpeak |
Solutions bas-coût |
Idéales pour les recherches de fichiers HTML et |
Dtsearch Innerprise Ultraseek Youramigo Mondosoft |
Open |
Moins puissants que leurs contreparties commerciales mais bien |
ht://dig Swish-e Lucene |
Les clients mettent
la pression
du marché. Il faut comprendre en effet que, depuis 3 ou 4 ans, la situation a
changé et que Google en est le principal responsable. En effet, les personnes qui
lont utilisé durant leurs études ne comprennent pas que rechercher sur lintranet
ne soit pas aussi simple que de rechercher sur le web. Il faut dire que pour
ceux quon appelle les travailleurs du savoir cette activité est à la fois indispensable
et chronophage : indispensable parce que les cabinets détudes saccordent
à affirmer que 80 à 85% de linformation numérique disponible dans les organisations
est non-structurée, chronophage parce que, selon IDC, ils consacrent en moyenne
9,5 heures par semaine à la rechercher, soit entre 20 et 25% de leur temps de
travail total[1].
Létude « Global Executive Survey » menée en 2005 sur
7800 managers par Mc Kinsey Consulting[2] nous
apprend par ailleurs que 30% des chefs dentreprise interrogés considèrent
quil est difficile de trouver linformation utile à la prise de décision.
ne lest pas : léquation impossible
cest que la recherche dinformation en entreprise est plus complexe à mettre
en uvre que la recherche sur le web. A cela plusieurs raisons.
Tout dabord les internautes ont vis-à-vis dun moteur comme
Google des attentes modérées. Même sils souhaitent un minimum de pertinence
ils ont conscience que les résultats obtenus sont génériques. Autant le Pagerank
Google se révèle performant dans un contexte général autant il na pas de
raison dêtre dans une entreprise composée de groupes dindividus pour lesquels
la pertinence est relative aux métiers exercés. Ainsi là où les ingénieurs
dune société pharmaceutique auront besoin de retrouver des formules chimiques,
les comptables de cette même société voudront pouvoir extraire dun coup les
bilans des dix dernières années et les commerciaux identifier des contacts via
lapplication de CRM.
Quand linternaute lance ses requêtes comme autant de
bouteilles à la mer le travailleur du savoir sait exactement ce quil attend et
se sent frustré par le manque de résultats.
Autre problème de taille, celui de la restriction daccès
aux données de lentreprise. Cest une chose de mettre en place un moteur en
open source capable dindexer des bases documentaires, cen est une autre que de
permettre de rechercher des documents en respectant une politique de droits
daccès. Cela nécessite des réglages pointus, voire des développements supplémentaires
pouvant lourdement grever le budget initial dun projet.
Enfin, et pour faire court, citons aussi le problème de la
variété dentrepôts informationnels présents dans une organisation : fichiers
bureautiques, bases de données relationnelles, messageries, annuaires LDAP, documents
html présents sur lintranet, lextranet et le site web de la société, sans
oublier le contenu de systèmes anciens mais toujours fonctionnels de type
mainframes ou les bases documentaires de fournisseurs de contenus.
Au final cest autant de connecteurs quil faudra développer
pour permettre la prise en compte de ces données hétérogènes par un moteur de
recherche.
Google dynamise le
marché
perçu il y a 3 ans en lançant son offre de « search appliances ». Ces
boîtes noires mixant hardware et software présentées comme le « plug and
play » de la recherche dinformation connaissent une grande popularité.
Normale, la société a cassé les prix et propose son produit à partir de 30000$ là où loffre de
ses concurrents oscille entre 50000 et 1 million de dollars. Google propose
même Google Mini, une version bridée à 50000 documents pour 2995$ ; plutôt
tentant pour une PME.
Avec cette entrée remarquée Google sest attaqué au cur du
problème, le prix !
En effet, un moteur de recherche dentreprise cétait jusque
là de nombreuses fonctionnalités, des possibilités de réglages fins, des offres
modulaires mais aussi des prestations de conseil en amont, un temps de
déploiement pouvant atteindre plusieurs semaines et une maintenance
indispensable.
En ramenant le moteur de recherche dentreprise à sa simple
expression Google a donné limpression que tout cela nétait pas si compliqué
et que les éditeurs traditionnels avaient peut-être exagéré la difficulté
dintégration pour améliorer leurs marges.
Si les services marketing de ces sociétés ont forcément joué
de ces arguments pour vendre de la prestation il faut reconnaître que cétait à
peine amplifié et cest ce que Google est en train de découvrir. La firme de
Mountain View a en effet annoncé en septembre dernier quelle créait un
programme de partenariat intitulé « Google Enterprise Professional »
afin de travailler avec des intégrateurs. Les « search appliances »
ne seraient-elles pas si « plugs and play » que cela
finalement ?
Malgré tout il faut reconnaître que si Google a appris à ses
dépens quune diversification était toujours délicate à mener, son arrivée a
forcé ses concurrents à se questionner sur leurs offres et à les faire évoluer.
Cest ainsi par exemple que Verity a racheté Ultraseek en 2002 afin de proposer
un produit dentrée de gamme. Cà a été aussi pour eux loccasion daffûter leurs
argumentaires afin dexpliquer pourquoi leurs solutions étaient plus que de
simples « appliances » et en quoi cela était important en terme de retour
sur investissement.
Angela Ashenden, consultante senior chez Ovum, analyse:
« le changement que nous sommes en train de voir actuellement est la
création de ce que jappelle le marché de la «recherche simple» (simple
search), dans lequel les fonctionnalités fournies ne sont pas les plus
perfectionnées mais sont évolutives et faciles à déployer et à maintenir. ()
Il y aura encore besoin de technologies telles que celles fournies par Autonomy
et Verity, mais leur prix sera remis en question () Cette acquisition donne à
la nouvelle compagnie une position renforcée () et lui offre peut-être sa
meilleure chance de rester dans la course. »
Microsoft se positionnent
pour les acteurs traditionnels du marché tant que ce dernier ne décide pas de
racheter une société proposant un moteur de recherche perfectionné. Linquiétude
pour eux vient surtout dacteurs dont la puissance est sans doute pour beaucoup
dans lopération Autonomy-Verity. Susan Feldman indiquait dans une interview
donnée à Searchmanagement.com au moment du rachat « quelle serait
surprise quil ny ait pas plus de consolidation () Les « large
players » arrivent sur le marché et la recherche dinformation est un
élément indispensable de toute architecture informatique () tous les grands
acteurs des systèmes dinformation sont en train de doter leurs plateformes
dun module de recherche ».
Ainsi comme on la vu les mouvements stratégiques sont
patents. IBM par exemple, semble maintenant réunir toutes les briques
nécessaires à la fourniture dune offre modulaire permettant de répondre au
mieux aux besoins de ses clients.
Loffre dOracle incluant Matchpoint de Triplehop nest pas
encore au point mais elle completera,
voire remplacera, Oracle Text. Difficile en revanche de savoir si, comme
Omnifind, elle sera fonctionnelle en dehors de lenvironnement de léditeur.
Seul Microsoft semble être une fois de plus en panne sur ce
marché. La société intègre bien sûr des fonctionnalités avancées de recherche
sur son portail collaboratif Sharepoint Server et a présenté cette année son
Desktop Search Engine. Pourtant même si on se doute que le géant de Redmond a
des ambitions, ses annonces entretiennent le flou. Ainsi après avoir clamé en
début dannée que Vista, son nouveau sytème dexploitation, intègrerait de
puissantes fonctionnalités de recherche la société a prévenu récemment quelles
ne seraient sans doute pas disponibles fin 2006, date programmée de sa sortie.
moteurs de recherche dentreprise
Si les alliances et les rachats sont une manière de résister,
linnovation en est une autre.
a
besoins de lutilisateur final via la mise à disposition des fameux moteurs de
recherche personnels (« desktop search »). Biens que des outils comme
DTsearch ou Armadillo existent depuis plusieurs années ils restaient confinés
dans le petit cercle des professionnels de linformation. Ce qui est nouveau cest
que les « majors players » nhésitent plus à développer ou à racheter
ces solutions. Pourquoi cet engouement ? La raison en est simple, outre le
fait quils répondent à un besoin réel des utilisateurs[3] ils
sont considérés par ces sociétés comme un « pied dans la porte »
indispensable : séduisez les employés par un logiciel de productivité
personnelle performant et vous jouirez dune image de marque susceptible
dinfluer sur le choix de plateformes plus conséquentes.
Par ailleurs noublions pas que ces solutions, souvent
gratuites, sont aussi des supports publicitaires générant un revenu non négligeable.
2006 devrait donc voir apparaître de nouveaux moteurs de
recherche personnels mais aussi se généraliser des fonctionnalités encore à
létat de tendances (voir encadré). Citons pêle-mêle la recherche floue,
lextraction et le classement automatique de noms de personnes ou
dentreprises, des fonctionnalités de text-mining, la création de requêtes
implicites en fonction du contexte de lutilisateur, le langage naturel ou
encore la recherche distribuée (P2P). Mais la tendance forte pourrait encore
une fois venir du web et notamment de ce quon appelle dorénavant les
« folksonomies », téléscopage de langlais « folks », les
gens, et du terme taxonomie. Lexpression désigne une manière de classer
linformation à plusieurs et de faire ainsi émerger un vocabulaire spécifique
aux différents métiers dune organisation. Ces folksonomies ne remplaceraient
évidemment pas les moteurs de recherche mais pourraient permettre de mieux
cibler des requêtes en les couplant à un système de classification à facettes.
Gageons quavec ce potentiel dinnovation et lensemble des
mouvements stratégiques qui agitent ce marché lannée 2006 devrait encore se
révéler passionante.
Linnovation dans les moteurs de recherche dentreprise : paroles
dexpert
Voici les réponses de 3
experts que nous avons interrogé à la question suivante : Quels sont
daprès vous les prochains grand challenges (techniques, commerciaux,) pour
les éditeurs de moteurs de recherche dentreprise :
Susan Feldman, Research Vice President Content Technologies dIDC : « Les challenges
techniques de lannée à venir sont dunifier laccès à des formats multiples
répartis dans des lieux de stockage variés, rechercher à la fois dans des
données et du contenu et devenir plus « interactifs ». Dans le champ
technique pure les solutions « pure players » sont loin devant leurs
concurrents »
Avi Rappoport, consultante spécialisée (www.searchtools.com): « Je dirais
lextraction de noms propres automatique (entity extraction), lassociation
automatique de métadonnées, la possibilité de fractionner un document
multi-thématique en sous-documents, la prise en compte des documents
multimedias et lintégration avec les systèmes de gestion de contenu. »
Martin White, rédacteur de lEnterprise Search Guidebook 2005 (www.freepint.com) :
« – Rendre
lintégration plus simple
– Pouvoir chercher en même
temps dans des données non-structurées et structurées. Cest actuellement
possible mais peu convaincant
– Pouvoir chercher de
manière plus précise dans des documents multimedias
– Convaincre les
organisations des bénéfices apportés par un moteur de recherche performant »
Sites
ressource :
CMSwatch :
http://www.cmswatch.com/
Information
Today : http://www.infotoday.com/
Search
Tools: http://www.searchtools.com/
Freepint: http://www.freepint.com/
[1] The Hidden Costs of Information Work. Susan Feldman Joshua Duhl,
Julie Rahal Marobella and Alison Crawford. IDC White Paper 05c4405A, Mars 2005.
[2] The McKinsey Global Survey of Business Executives , July 2005
dans lenquête Forrester citée plus haut classent les technologies leur
permettant daméliorer leur poste personnel comme les plus importantes pour
leur activité