Les moteurs de recherche internes

En savoir plus

Afin de faciliter la recherche de documents dans ses sources de données hétérogènes (intranets, bases de données, applications métiers, annuaires...) et optimiser leur indexation, les entreprises sont de plus en plus nombreuses à mettre en place une solution de moteur de recherche interne.

En phase régulière de concentration - avec notamment les rachats de Verity par Autonomy en 2005 et de Fast par Microsoft début 2008 - le marché de la recherche interne fait intervenir plusieurs types d'acteurs dont notamment des pure players comme Autonomy, Endeca ou Fast et d'autres, plus généralistes, mais ayant pénétré en force ce marché, à l'image de Google ou encore d'Exalead.

 

 
Les critères de choix
 
 1Indexation sémantique vectorielle et analyse linguistique par lemmatisation et approximation 
 2Profondeur de l'indexation sémantique et connecteurs natifs vers les sources de données hétérogènes  
 3 Nombre de langues supportées par défaut 

 

Les éditeurs de moteurs de recherche interne sont entrés de plein pied dans l'univers de l'analyse sémantique, et ont doté leurs offres de fonctionnalités d'indexation et de linguistique natives de plus en plus sophistiquées. A l'image par exemple de l'indexation sémantique vectorielle permettant d'associers en cluster des contenus similaires basés sur des concepts et non plus les seuls termes de sa recherche.

Ou encore des capacités d'analyse linguistique par lemmatisation. "Cette gestion des formes inflectives et de réduction des mots en forme canonique du langage permet d'élargir au maximum les résultats de sa recherche en tenant compte par exemple des pluriels, des conjugaisons, des infinitifs et des déclinaisons", précise Antoine Ballerin, responsable des ventes de l'éditeur Endeca.

"Dans une entreprise où les sources d'informations et de données sont très variées, il est intéressant d'opter pour un moteur de recherche qui disposera de façon native d'un grand nombre de connecteurs dédiés et capable de gérer des dizaines de formats de données différents", fait savoir Cédric Chauvry, directeur technique de Zeni Corporation.

Pour autant, lorsque la solution n'en dispose pas - et suivant la façon dont ses contenus sont organisés - recourir aux kits d'interfaces de programmation (API) peu suffire, pour peu qu'ils soient proposés en standard avec la solution. Enfin, le nombre de langues gérées par défaut (recherche, navigation, correction orthographique, synonymie...) pourra également constituer un critère de choix intéressant notamment dans un contexte d'entreprise multilingue et/ou géographiquement éclaté.

 


JDN SolutionsEnvoyerImprimerHaut de page