Le marché français semble particulièrement dynamique
sur le créneau des systèmes de recherche. Et pour preuve : Depuis la parution
de notre premier panorama sur le sujet en 2001, force est de constater la montée
en puissance de plusieurs nouveaux acteurs hexagonaux sur ce terrain. Parmi eux,
on compte notamment Lingway, Antidot et Exalead. Tour d'horizon des technologies
et des positionnements.
Lingway combine offres
horizontales et verticales Lancée en 2000 par des anciens
de Lexiquest (SPPS), Lingway se positionne à l'origine comme une société
de services spécialisée dans le domaine de gestion des connaissances.
Reposant entièrement sur des fonds propres, elle développe courant
2001 une offre de solutions de recherche. "Nous proposons à la fois
une infrastructure généraliste adaptable en fonction des projets.
Ainsi qu'une gamme d'applications packagées, ciblant notamment les questions
liées à la propriété intellectuelle (les brevets par
exemple)", détaille Bernard Normier, Président de Lingway.
Le
but de ces produits ? Répondre aussi bien aux problématiques
de recherche documentaire que d'assistance à la lecture de textes. Face
à ce double objectif, Lingway a choisi d'articuler sa plate-forme autour
d'une technologie d'analyse sémantique. Son moteur fait notamment appel
des ontologies de termes (associations de concepts connexes) pour étendre
ou préciser les requêtes. "Cela peut-être combiné
à un plan de classement (ou taxonomie) pour permettre à l'utilisateur
de mieux se repérer dans les réponses fournies" note le responsable
de Lingway.
Les fonctions d'aide à la lecture s'appuient quant elles sur des mécanismes de
traitement assurant le reconnaissance au sein des documents de différentes expressions,
des entités nommées (nom, lieu, etc.) ou des faits notamment. Dans le cas d'un
brevet, elles pourraient potentiellement localiser plusieurs passages clés : la
référence à l'objet du brevet ainsi qu'à ses avantages par exemple. A partir de
cette opération, l'outil génère pour finir un plan du fichier et applique à
son contenu un certain code couleur.
Antidot : une offre en mode
ASP A la différence de Lingway, Antidot
commercialise sa solution en mode hébergé (ASP). Une caractéristique
que l'éditeur présente d'ailleurs comme l'un de ses principaux facteurs
de différentiation. Fondée en 1999, cette société
issue d'Infonie intègre l'ensemble des possibilités d'un module
de recherche Web digne de ce nom : ses réponses sont calculées
en fonction de l'emplacement, de la fréquence ainsi que de la proximité
des termes demandés au sein des pages. Adaptable aussi bien aux enjeux
internes que Web, il parcourt les sources de données par le biais d'agents
de collecte en prenant en compte tout type de format.
"Nous développons parallèlement une offre dédiée à l'e-commerce conçue
pour indexer les catalogues produit", complète Christelle Ott, Directrice Marketing
et Commerciale d'Antidot. Une application qui, notons le, s'accompagne d'un mécanisme
de recherche floue visant à prendre en compte les saisies de requêtes approximatives
- contenant des fautes d'orthographe par exemple. Autre extension possible : l'ajout
de thésaurus métier. "Ils permettent de proposer des entrées contenant une
ou plusieurs fiches de produits synonymes (ventilateurs pour ventilos, etc.).
Exalead
: un référentiel de données Face aux acteurs traditionnels du monde
de la recherche, Exalead marque sa différence en se plaçant résolument
au croisement de deux positionnements. "Nous avançons un moteur de
recherche plein texte ainsi que des dispositifs d'analyse sémantique et
statistique. Le tout couplé à un référentiel XML de
données d'entreprise multisource", résume son directeur général,
François Bourdoncle. Cet acteur parisien créé en 1999 qui, à
la manière de Lingway, commercialise son environnement en licence définitive
(uniquement) prône une indexation quasi
temps réel des informations.
En amont, l'outil d'Exalead commence par construire
des vues métier en faisant appel à des données réparties.
Il peut s'agir par exemple de recomposer un annuaire de salariés à
partir d'informations en provenance d'un système LDAP et d'une plate-forme
de gestion des ressources humaines. Il sera
possible de rapatrier l'ensemble des fichiers indexés en local si besoin.
"Pour répondre aux besoins de recherche en
tant que tels, le produit effectue ensuite divers traitements linguistiques et
statistiques : lemmatisation des mots (retour à la racines des termes), extrait
des groupes nominaux les plus courants, et corrections orthographiques automatiques
- la base XML faisant ici office de corpus de référence", détaille
François Bourdoncle.