31/05/01
Zoom
sur le marché des moteurs de recherche avec FRA
La multiplication des sources
de données dans les entreprises rend les processus de
traitement de l'information de plus en plus complexes.
Et les impératifs de réactivité et de pertinence des
réponses à apporter dans de nombreux domaines (coordonnées,
procédures, caractéristiques produit, etc.) placent
souvent la gestion documentaire, et en particulier la
fonction de recherche, parmi les postes les plus critiques
d'une société. Conscient de cette problématique, l'agence
web FRA
vient de publier un livre blanc, qui passe en revue
les besoins des entreprises en matière de gestion
de la connaissance, ainsi que les principales offres
proposées dans ce secteur.
Baptisée
Panorama
des solutions de gestion des connaissances, l'étude
de FRA distingue plusieurs catégories d'outils de recherche.
"Un récapitulatif qui suit également le processus de
maturation des technologies sous-jacentes", précise
Jean-Louis Bénard, directeur général de la société.
Moteurs
sémantiques : intégrer
le sens du langage
Selon l'agence Web, les premiers moteurs se caractérisaient
par une fonction de recherche plein texte exclusivement
concentrée sur les données non-structurées - c'est-à-dire
celles présentes dans le corps des documents. Par la
suite, les évolutions technologiques ont permis
d'étendre la lecture aux données structurées.
"Notamment en utilisant les métadonnées qui, en HTML,
apparaîssent au dessus du corps du document (dans
les balises META)", explique Jean-Louis Bénard.
Beaucoup d'autres formats de fichiers (tels que les
documents Word) adoptent le même type de procédé - avec
un mode de traitement différent.
Afin d'affiner plus encore les recherches, les moteurs
dits sémantiques ont ensuite fait leur apparition, leur
objectif principal étant d'intégrer le
sens du langage. Pour cela, ils s'appuient sur des dictionnaires
de concepts. "Grâce à ce type de solutions, une société
particulière peut par exemple personnaliser son outil
de recherche en lui adjoignant ses propres thésaurus
spécialisés", précise Jean-Louis
Bénard.
Moteurs
multi-dimensionnels,
as de la catégorisation
Pour finir, sont venus les moteurs multi-dimensionnels:
une technique qui s'inspire de celle des cubes OLAP
(OnLine Analytical Processing) - utilisée notamment
par les datawarehouses, ou entrepôts de données au sein
des systèmes décisionnels . "Cette méthode
affine la catégorisation des documents, ainsi que les
procédés de requêtes croisées", indique Jean-Louis Bénard,
avant d'affirmer que "couplé à la recherche sémantique,
ce type de moteur peut devenir puissant". Un paramétrage
au cas par cas reste néanmoins nécessaire à l'optimisation
de son utilisation. Mais, une fois cette condition fastidieuse
remplie, une telle solution peut par exemple contribuer
à extraire d'une base de données non paramétrée
l'ensemble des factures clients relatives à un
marché donné.
Les
acteurs recommandés par FRA
Parmi
les principaux éditeurs de solutions du marché, quatre
sortent du lot, selon le responsable de FRA : "Autonomy,
Sinequa et Arisem dans le domaine des moteurs sémantiques
et Instranet dans celui du multi-dimensionnel". Jean-Louis
Bénard attire en particulier notre attention
sur Arisem et Sinequa. "Le premier développe
plutôt une approche progicielle", explique-t-il. "Il
intègre un éditeur visuel de gestion de concepts". Une
fonction grâce à laquelle une entreprise pourra élaborer
son propre dictionnaire de termes, et définir des liens
entre ces derniers ou encore les regrouper sous forme
de vecteurs sémantiques (eux-même associés à d'autres
instances). "Sinequa, de son côté, propose
un moteur sémantique utilisable sous forme de brique
intégrable à une plate-forme ou pouvant faire l'objet
de développements spécifiques. Cette solution s'avère
donc mieux adaptée à une problématique de sur-mesure".
Enfin, un acteur "entrant" mériterait une
attention particulière. "Il s'agit de Microsoft avec
son produit SharePoint Portal Server", confie Jean-Louis
Bénard. "Certes, cette solution n'offre pas les
finesses d'une technologie multi-dimensionnelle ou de
certains moteurs sémantiques que nous avons cités, mais
elle a le mérite de s'intégrer à Microsoft Office, tout
en offrant d'excellentes qualités d'ouverture". Des
API (interfaces de programme d'application) lui permettent
en effet de s'interfacer avec des progiciels externes,
voire de faciliter les développements spécifiques.
|