Comment l'INIST articule son
portail documentaire autour de LexiQuest Mine Par le JDNet Solutions (Benchmark Group) URL : http://www.journaldunet.com/solutions/0204/020403_inist.shtml
|
|
Créer
un accès mutualisé à l'ensemble de son fond documentaire,
qui soit également personnalisable en fonction des centres d'intérêts
des visiteurs. Telle est la philosophie du projet de portail lancé
fin 1999 par l'Institut de
l'Information Scientifique et Technique (INIST). Ciblant les chercheurs
du monde académique et privé (le CNRS
notamment), ce site devait plus précisément permettre à ses utilisateurs
de créer plusieurs dossiers sur mesure pour classer les articles
et autres documents scientifiques nécessaires à leurs travaux.
Autre objectif : bénéficier d'un chassis applicatif suffisamment
souple pour accueillir des services tiers -bases de données, moteurs
de recherche disponibles sur le Web, etc. "Et ceci dans le but de pouvoir
réutiliser notre solution par la suite", complète Laurent
Schmitt, chef de projet informatique à l'INIST. Un socle applicatif basé sur le moteur de Verity D'ores et déjà déployés par l'institut dans le cadre de projets plus anciens, la base de données Oracle et le moteur de recherche de Verity (Topic) s'imposent d'eux-mêmes Pourquoi une telle option ? Traduit pour commencer en français et en anglais, le site a pour vocation d'intégrer par la suite de nouvelles langues. Or, une méthode de gestion dynamique de la présentation semblait la mieux adaptée à la gestion d'un site multi-lingue. "Sans compter qu'un prototype devait être présenté quelques mois après, insiste t-on à l'INIST. Pour l'équipe technique de l'institut, il est par conséquent nécessaire d'opter pour une logique applicative qui soit à la fois rapide à développer et aisée à corriger. Un assistant de requêtes pour aider les chercheurs Baptisé ConnectSciences, le portail de l'INIST qui est en ligne depuis septembre 2001 donne accès aux nouveautés des deux principales bases documentaires de l'institut, soit les trois derniers mois de Pascal (sciences médicales et techniques) et la dernière année de production de Francis (sciences humaines et économiques). Principale problématique sous-jacente : fournir un service permettant aux visiteurs de retrouver un ou plusieurs documents dont il ne connaîtrait pas forcément le vocabulaire ni les mots clefs utilisés d'indexation. D'où le besoin d'adjoindre au moteur de recherche Verity un assistant de requête. "Sans compter sa capacité à s'adapter à Topic, LexiQuest Mine nous a paru suffisamment stable et robuste pour prendre en charge l'ensemble de notre base terminologique, soit 1 Giga de données", souligne notamment Laurent Schmitt pour justifier le choix de la solution de Lexiquest. Une base de données terminologique Un dictionnaire général associé à sept autres... couvrant l'ensemble des thématiques traités par les fonds documentaires Pascal et Francis, le tout traduit dans deux langues. Le référentiel de concepts mis au point par l'INIST pour servir de socle à ce thésaurus représente au total seize bases terminologiques. Le système de cartes de Lexiquest Mine assurant la liaison entre ces concepts afin d'engendrer le jeu des propositions. Au final, l'outil de Lexiquest permet aux utilisateurs de ConnectSciences d'afficher, à partir de l'entrée d'un ou plusieurs mots-clés, une liste de concepts s'y rapportant -et ainsi d'affiner leur demande. Une fois la requête validée, il la traduit dans le langage de Topic qui se charge à son tour d'interroger les différents éléments d'indexations (mots clef, auteurs, titres, résumés, etc.) définie pour les différentes bases. Une intégration qui demande un mois Lors de la phase de déploiement, qui s'étend sur une période d'un mois, l'INIST demande à Lexiquest d'intervenir sur deux aspects principaux : l'optimisation des performances d'exécution des bases terminologiques d'une part, et la personnalisation de l'interface utilisateur en termes graphique et fonctionnel d'autre part. "Lexiquest Mine ne gère pas le XML en natif, ce qui nous a obligé à reformater et donc dupliquer certaines données terminologiques", regrette Laurent Schmitt. Hormis ces "quelques adaptations de détails", la mise en oeuvre du produit est présentée comme largement concluante. Quant au bilan du projet : "il est positif. ConnectSciences enregistre 1000 nouveaux abonnés par mois et plusieurs centaines de visites par jour", conclut le porte-parole. [Antoine Crochet Damais, JDNet] |