ANALYSE 
Sommaire Infrastructure 
Moteurs de recherche: quelques critères de choix
Volume, finesse d'analyse, multilinguisme, etc. Comment bien sélectionner un outil d'indexation.   (01/02/2005)
  En savoir plus
Dossier Gestion de contenu
Le principal critère de choix d'un moteur de recherche ? "La sélection d'un tel applicatif dépend en premier lieu du volume de contenu à traiter", lance sans hésiter Stéphane Chaudiron, Chargé de mission Ingénierie de la langue et nouvelles technologies de l'information au sein du Ministère de l'Education Nationale, de la Recherche et de la Technologie.

Pour gérer un index de très grande taille, comme c'est le cas dans le domaine de la recherche Web, il sera en effet difficile d'aller au delà d'une simple analyse statistique, ce qui contribue à restreindre le choix à cette dernière catégorie de moteur de recherche.

L'application d'une couche sémantique se révèle en effet trop lourde à exécuter dans le contexte d'une base de données trop importante. "La puissance croissante des serveurs machines gomme de plus en plus cette difficulté", pondère Stéphane Chaudiron. Certaines solutions, telles que Qristal (du français Synapse), tenteraient d'ailleurs de dépasser cet obstacle en commençant par restreindre l'étendu de l'index à couvrir par un traitement statistique préalable, avant d'y appliquer des fonctions linguistiques d'affinage.

Certains acteurs de la recherche, Autonomy par exemple, demeurent concentrés sur une approche purement statistique, en affirmant être capables de bâtir des modèles de langue en s'appuyant uniquement sur le corpus de contenu à indexer. "Dans le cas de besoins spécifiques, impliquant la prise en compte de thématiques particulières (métiers), ce type d'applications ne suffit pas", affirme le chargé de mission. La gestion de tels champs informationnels doit être prise en charge par une couche de gestion sémantique - combinant par exemple dictionnaires, ontologies et thésaurus.

La performance de la couche sémantique définira la finesse de l'analyse du moteur. Une qualité qui renvoie au deuxième grand critère de choix d'une telle plate-forme. Cet élément fonctionnel est censé répondre à deux grandes problématiques utilisateurs : d'une part cerner l'univers sémantique auquel renvoie tel ou tel terme, avec à la clé l'objectif de lever l'ambiguïté des mots polysémiques, d'autre part situer l'analyse aussi bien au niveau de la phrase que du paragraphe - en ayant la possibilité par exemple de retrouver les références de pronoms démonstratifs.

Finesse d'analyse et fonction interlingue
Certains systèmes proposent des dispositifs supplémentaires d'analyse, comme la classification ou encore la création de résumés de document pour aider l'utilisateur dans sa recherche. Des possibilités qui présentent des performances de traitement différentes selon les outils, certains produits allant par exemple jusqu'à reformuler un texte lors de sa synthèse, au delà de l'extraction de phrases.

  En savoir plus
Dossier Gestion de contenu
Dernier critère de choix évoqué : le caractère multilingue de la solution. "En général, une offre de recherche réellement multilingue est également interlingue, c'est-à-dire capable de prendre en charge une requête saisie dans une langue donnée pour l'appliquer à une base de contenu dans une autre langue", ajoute Stéphane Chaudiron.
Antoine CROCHET-DAMAIS, JDN Solutions Sommaire Infrastructure
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters