Journal du Net > Solutions >  Zoom sur le marché des moteurs de recherche avec FRA
Article
 
31/05/01

Zoom sur le marché des moteurs de recherche avec FRA

  Envoyer Imprimer  

La multiplication des sources de données dans les entreprises rend les processus de traitement de l'information de plus en plus complexes. Et les impératifs de réactivité et de pertinence des réponses à apporter dans de nombreux domaines (coordonnées, procédures, caractéristiques produit, etc.) placent souvent la gestion documentaire, et en particulier la fonction de recherche, parmi les postes les plus critiques d'une société. Conscient de cette problématique, l'agence web FRA vient de publier un livre blanc, qui passe en revue les besoins des entreprises en matière de gestion de la connaissance, ainsi que les principales offres proposées dans ce secteur.

Baptisée Panorama des solutions de gestion des connaissances, l'étude de FRA distingue plusieurs catégories d'outils de recherche. "Un récapitulatif qui suit également le processus de maturation des technologies sous-jacentes", précise Jean-Louis Bénard, directeur général de la société.

Moteurs sémantiques : intégrer le sens du langage
Selon l'agence Web, les premiers moteurs se caractérisaient par une fonction de recherche plein texte exclusivement concentrée sur les données non-structurées - c'est-à-dire celles présentes dans le corps des documents. Par la suite, les évolutions technologiques ont permis d'étendre la lecture aux données structurées. "Notamment en utilisant les métadonnées qui, en HTML, apparaîssent au dessus du corps du document (dans les balises META)", explique Jean-Louis Bénard. Beaucoup d'autres formats de fichiers (tels que les documents Word) adoptent le même type de procédé - avec un mode de traitement différent.

Afin d'affiner plus encore les recherches, les moteurs dits sémantiques ont ensuite fait leur apparition, leur objectif principal étant d'intégrer le sens du langage. Pour cela, ils s'appuient sur des dictionnaires de concepts. "Grâce à ce type de solutions, une société particulière peut par exemple personnaliser son outil de recherche en lui adjoignant ses propres thésaurus spécialisés", précise Jean-Louis Bénard.

Moteurs multi-dimensionnels, as de la catégorisation
Pour finir, sont venus les moteurs multi-dimensionnels: une technique qui s'inspire de celle des cubes OLAP (OnLine Analytical Processing) - utilisée notamment par les datawarehouses, ou entrepôts de données au sein des systèmes décisionnels . "Cette méthode affine la catégorisation des documents, ainsi que les procédés de requêtes croisées", indique Jean-Louis Bénard, avant d'affirmer que "couplé à la recherche sémantique, ce type de moteur peut devenir puissant". Un paramétrage au cas par cas reste néanmoins nécessaire à l'optimisation de son utilisation. Mais, une fois cette condition fastidieuse remplie, une telle solution peut par exemple contribuer à extraire d'une base de données non paramétrée l'ensemble des factures clients relatives à un marché donné.

Les acteurs recommandés par FRA
Parmi les principaux éditeurs de solutions du marché, quatre sortent du lot, selon le responsable de FRA : "Autonomy, Sinequa et Arisem dans le domaine des moteurs sémantiques et Instranet dans celui du multi-dimensionnel". Jean-Louis Bénard attire en particulier notre attention sur Arisem et Sinequa. "Le premier développe plutôt une approche progicielle", explique-t-il. "Il intègre un éditeur visuel de gestion de concepts". Une fonction grâce à laquelle une entreprise pourra élaborer son propre dictionnaire de termes, et définir des liens entre ces derniers ou encore les regrouper sous forme de vecteurs sémantiques (eux-même associés à d'autres instances). "Sinequa, de son côté, propose un moteur sémantique utilisable sous forme de brique intégrable à une plate-forme ou pouvant faire l'objet de développements spécifiques. Cette solution s'avère donc mieux adaptée à une problématique de sur-mesure".

Enfin, un acteur "entrant" mériterait une attention particulière. "Il s'agit de Microsoft avec son produit SharePoint Portal Server", confie Jean-Louis Bénard. "Certes, cette solution n'offre pas les finesses d'une technologie multi-dimensionnelle ou de certains moteurs sémantiques que nous avons cités, mais elle a le mérite de s'intégrer à Microsoft Office, tout en offrant d'excellentes qualités d'ouverture". Des API (interfaces de programme d'application) lui permettent en effet de s'interfacer avec des progiciels externes, voire de faciliter les développements spécifiques.


JDN Solutions Envoyer Imprimer Haut de page

Sondage

Les bases de données open source sont-elles désormais à la hauteur pour les systèmes d'entreprise ?

Tous les sondages