Afin de faciliter la recherche
de documents dans ses sources de données hétérogènes
(intranets, bases de données, applications métiers, annuaires...)
et optimiser leur indexation, les entreprises sont de plus en plus nombreuses
à mettre en place une solution de moteur de recherche interne.
En
phase régulière de concentration - avec notamment les rachats
de Verity par Autonomy en 2005 et de Fast par Microsoft début 2008 - le
marché de la recherche interne fait intervenir plusieurs types d'acteurs
dont notamment des pure players comme Autonomy, Endeca ou Fast et d'autres,
plus généralistes, mais ayant pénétré en
force ce marché, à l'image de Google ou encore d'Exalead.
| Les
critères de choix | |
| 1 | Indexation
sémantique vectorielle et analyse linguistique par lemmatisation et approximation | |
| 2 | Profondeur
de l'indexation sémantique et connecteurs natifs vers les sources de données
hétérogènes | |
| 3 |
Nombre de langues supportées par défaut | |
Les éditeurs de moteurs de recherche
interne sont entrés de plein pied dans l'univers de l'analyse sémantique,
et ont doté leurs offres de fonctionnalités d'indexation et de
linguistique natives de plus en plus sophistiquées. A l'image par exemple
de l'indexation sémantique vectorielle permettant d'associers en cluster
des contenus similaires basés sur des concepts et non plus les seuls termes
de sa recherche.
Ou encore des capacités d'analyse linguistique
par lemmatisation. "Cette gestion des formes inflectives et de réduction
des mots en forme canonique du langage permet d'élargir au maximum les résultats
de sa recherche en tenant compte par exemple des pluriels, des conjugaisons, des
infinitifs et des déclinaisons", précise Antoine Ballerin, responsable
des ventes de l'éditeur Endeca.
"Dans une entreprise où les
sources d'informations et de données sont très variées, il est intéressant
d'opter pour un moteur de recherche qui disposera de façon native d'un grand nombre
de connecteurs dédiés et capable de gérer des dizaines de formats de
données différents", fait savoir Cédric Chauvry,
directeur technique de Zeni Corporation.
Pour autant, lorsque la solution
n'en dispose pas - et suivant la façon dont ses contenus sont organisés
- recourir aux kits d'interfaces de programmation (API) peu suffire, pour peu
qu'ils soient proposés en standard avec la solution. Enfin, le nombre
de langues gérées par défaut (recherche, navigation, correction
orthographique, synonymie...) pourra également constituer un critère
de choix intéressant notamment dans un contexte d'entreprise multilingue
et/ou géographiquement éclaté.