Ce panorama des solutions de moteurs de recherche vient compléter celui qui était consacré la semaine dernière aux solutions de veille en entreprise (lire l'article du 28/09/2005).
Le marché des moteurs de recherche d'informations en entreprise se découpe principalement en deux catégories : les moteurs statistiques d'une part, les moteurs sémantiques d'autre part.
Ainsi, le premier tableau rend notamment compte de la nature de la méthode d'analyse principale des moteurs de recherche, sachant que toutes les solutions présentées dans ce panorama sont autonomes et commercialisées indépendamment de la solution de veille globale à laquelle elles peuvent être rattachées (Arisem, Autonomy, Go Albert...).
Le 2e tableau renseigne sur les 4 principales fonctionnalités de recherche des solutions (approximative, phonétique, plein texte et langage naturel) alors que le 3e tableau est axé sur les multiples sources qui peuvent être analysées (Web, système de fichiers, annuaires LDAP et bases de données).
Enfin, le dernier tableau fournit plusieurs caractéristiques technologiques comme les environnements d'exploitation, la compatibilité avec les architectures 64 bits mais également des informations commerciales (tarification, mode de fourniture des solutions et principaux clients).
A la lumière du 1er tableau, on constate que ce sont les solutions reposant sur des moteurs d'analyse statistique qui sont les moins nombreuses. La méthode de remontée du contenu trouvée est ici fonction de la fréquence de l'apparition des mots clés recherchés dans les multiples sources de données (Web, annuaires...).
Nature du moteur et principaux formats et protocoles supportés
|
Editeur/Solution
|
Moteur
statistique
|
Moteur
sémantique
|
Langues et dictionnaires natifs
|
Acetic/
Zoom
|
|
x
|
6
|
Alogic/
Al calimm
|
|
x
|
NC
|
Antidot
/
Antidot Finder Suite
|
x
|
|
NC
|
Arisem
/
Kaliwatch Server
|
|
x
|
5
|
Atomz/
Atomz Search
|
|
x
|
21
|
Auracom/
Auraweb
|
|
x
|
1 (ANSI, UTF8)
|
Autonomy/
Idol Enterprise Desktop Search
|
x
|
|
NC
|
Convera/
RetrievalWare
|
|
x
|
15
|
Exalead/
Exalead Corporate
|
x
|
|
<21
|
Fast/
Fast Data Search
|
|
x
|
77
|
Go Albert/
Amy Enterprise Discovery
|
|
x
|
7
|
Hummingbird/
Hummingbird KM
|
|
x
|
13
|
PolySpot/
PolySpot Enterprise Search
|
x
|
|
<21
|
Sinequa/
Intuition Corporate Edition
|
|
x
|
18
|
Synomia/
Synomia Site Search
|
|
x
|
5
|
Verity
/
Ultraseek
|
|
x
|
40
|
Verticrawl
/
Intra-site
|
|
x
|
68
|
Editeur/Solution
|
Moteur
statistique
|
Moteur
sémantique
|
Langues et dict. natifs
|
L'autre méthode majoritairement adoptée par les solutions du marché est articulée autour d'un moteur d'analyse sémantique appréhendant un contenu au travers d'un contexte préalablement déterminé. Ces solutions sont en effet dotées de façon native d'un référentiel permettant la recherche de documents par rapport à un champs lexical et non plus uniquement à des mots clés.
Par ailleurs, la gestion multilingue des solutions est variable suivant les éditeurs, sachant que l'un d'eux affiche une gestion native - sans dictionnaire supplémentaire -, de quelque 77 langues.
La moyenne des langues gérées est cependant inférieure à la vingtaine.
Paramètres de la recherche
|
Editeur/Solution
|
Approximative
|
Phonétique
|
Langage naturel
|
Plein texte
|
Acetic/
Zoom
|
x
|
|
x
|
x
|
Alogic/
Al calimm
|
|
|
x
|
x
|
Antidot
/
Antidot Finder Suite
|
x
|
x
|
|
x
|
Arisem
/
Kaliwatch Server
|
x
|
|
x
|
x
|
Atomz/
Atomz Search
|
x
|
|
x
|
x
|
Auracom/
Auraweb
|
x
|
x
|
x
|
x
|
Autonomy/
Idol Enterprise Desktop Search
|
x
|
x
|
|
x
|
Convera/
RetrievalWare
|
x
|
|
x
|
x
|
Exalead/
Exalead Corporate
|
x
|
x
|
x
|
x
|
Fast/
Fast Data Search
|
x
|
x
|
x
|
x
|
Go Albert/
Amy Enterprise Discovery
|
x
|
x
|
x
|
x
|
Hummingbird/
Hummingbird KM
|
x
|
x
|
x
|
x
|
PolySpot/
PolySpot Enterprise Search
|
x
|
x
|
x
|
x
|
Sinequa/
Intuition Corporate Edition
|
x
|
x
|
x
|
x
|
Synomia/
Synomia Site Search
|
x
|
x
|
x
|
x
|
Verity
/
Ultraseek
|
x
|
x
|
x
|
x
|
Verticrawl
/
Intra-site
|
x
|
x
|
x
|
x
|
Editeur/Solution
|
Approximative
|
Phonétique
|
Langage naturel
|
Plein texte
|
La recherche plein texte est partagée par tous les éditeurs, tandis que la recherche phonétique n'est pas possible pour près de la moitié des solutions de ce panorama.
La recherche approximative est couplée à un correcteur d'orthographe, autorisant une certaine marge d'erreur dans la saisie d'un mot ou d'une expression recherchée. Cette fonction est partagée par 15 solutions sur 17.
Sources analysées par les moteurs de recherche
|
Editeur/Solution
|
Web
|
Système de fichiers
|
Annuaires LDAP
|
BdD ODBC/JDBC
|
Acetic/
Zoom
|
x
|
x
|
x
|
x
|
Alogic/
Al calimm
|
x
|
x
|
x
|
x
|
Antidot
/
Antidot Finder Suite
|
x
|
x (Unix/Linux NFS et Windows CIFS)
|
x
|
x
|
Arisem
/
Kaliwatch Server
|
x
|
x (File System Windows et Samba)
|
x
|
x
|
Atomz/
Atomz Search
|
x
|
|
|
x
|
Auracom/
Auraweb
|
x
|
|
|
x (Export Ascii)
|
Autonomy/
Idol Enterprise Desktop Search
|
x
|
x
|
x
|
x
|
Convera/
RetrievalWare
|
x
|
x (File System Windows)
|
x
|
x
|
Exalead/
Exalead Corporate
|
x
|
x (Windows et Unix)
|
x
|
x
|
Fast/
Fast Data Search
|
x
|
x
|
x
|
x
|
Go Albert/
Amy Enterprise Discovery
|
x
|
x (File System Windows et Samba)
|
x
|
x
|
Hummingbird/
Hummingbird KM
|
x
|
x (File System Windows, Novell et Unix)
|
x
|
x
|
PolySpot/
PolySpot Enterprise Search
|
x
|
x
|
x
|
x
|
Sinequa/
Intuition Corporate Edition
|
x
|
x (Windows et Unix)
|
x
|
x
|
Synomia/
Synomia Site Search
|
x
|
x (Unix)
|
x
|
x
|
Verity
/
Ultraseek
|
x
|
x
|
|
x
|
Verticrawl
/
Intra-site
|
x
|
x (non ASP)
|
|
x
|
Editeur/Solution
|
Web
|
Système de fichiers
|
Annuaires LDAP
|
BdD ODBC/JDBC
|
Parmi les multiples sources de contenus que les moteurs de recherche sont en mesure de balayer, les données issues de pages Web, ainsi que celles contenues dans les bases de données hétérogènes de l'entreprise, sont partagées par l'ensemble des solutions.
Du côté des environnements techniques, l'interopérabilité sous un système d'exploitation Windows et Linux fait jeu égal : près de 12 solutions sur 17 sont invocables sous Windows, 10 sur 17 le sont sous Linux. La compatibilité avec une architecture 64 bits est encore peu répandue, même si plusieurs éditeurs signalent que cette fonctionnalité sera disponible d'ici à 2006.
Caractéristiques techniques et informations commerciales
|
Editeur/Solution
|
Techno.
|
Suport 64 bits
|
Mode
|
Prix
|
Clients
|
Acetic/
Zoom
|
Windows
|
|
Licence
|
Dès 4 500 € pour 1 langue
|
Airbus, BNP Paribas, INRA...
|
Alogic/
Al calimm
|
Unix et Linux
|
NC
|
Licence
|
NC
|
EDF, France Télécom, Ministère de l'Agriculture et de la Pêche...
|
Antidot
/
Antidot Finder Suite
|
Unix et Linux
|
|
Licence, hébergé et location
|
Dès 20 000 € (licence) et dès 500 € / mois (hébergé)
|
TF1, Crédit Agricole, Benchmark Group...
|
Arisem
/
Kaliwatch Server
|
Windows
|
|
Licence et hébergé
|
Dès 30 000 € (licence)
|
Alcatel, CNES, Thalès...
|
Atomz/
Atomz Search
|
Unix
|
NC
|
Hébergé
|
NC
|
NC
|
Auracom/
Auraweb
|
Windows, Unix, Linux, AIX
|
|
Licence
|
Dès 250 € / mois
|
Ministère de l'Economie et des finances, CNAMTS, darty.fr...
|
Autonomy/
Idol Enterprise Desktop Search
|
Windows, Unix, Linux, AIX
|
x
|
Licence
|
NC
|
NC
|
Convera/
RetrievalWare
|
Windows et Unix
|
x
|
Licence
|
Dès 50 000 €
|
PSA, Pfizer, Eutelsat...
|
Exalead/
Exalead Corporate
|
Windows, Unix, Linux
|
x
|
Licence
|
Dès 15 000 €
|
Air Liquide, Manutan, AOL France...
|
Fast/
Fast Data Search
|
Solaris, Linux, Windows, HP-UX et AIX
|
x
|
location
|
NC
|
NC
|
Go Albert/
Amy Enterprise Discovery
|
Windows,, Linux et Solaris
|
|
Licence
|
Dès 12 000 €
|
Unesco, Valéo, Radio France...
|
Hummingbird/
Hummingbird KM
|
Windows, Unix
|
x (Uniquement pour Solaris)
|
Licence
|
NC
|
NC
|
PolySpot/
PolySpot Enterprise Search
|
Windows, Linux et Unix
|
x
|
Licence
|
Dès 15 000 €
|
BNP-Paribas, Suez, Pasteur...
|
Sinequa/
Intuition Corporate Edition
|
Windows, Unix, Linux, AIX
|
|
Licence
|
Dès 20 000 €
|
Lactalis, Le Monde, St Gobain...
|
Synomia/
Synomia Site Search
|
Unix
|
|
Hébergé
|
Dès 300 € / mois
|
Liberation.fr, Doctissimo.fr, edf.fr...
|
Verity
/
Ultraseek
|
Windows,, Linux et Unix
|
x
|
Licence
|
Dès 62 500 €
|
Alactel, Renault, Arcelor...
|
Verticrawl
/
Intra-site
|
Windows,, Linux, Unix et Mac
|
x
|
Hébergé
|
Dès 30 € / mois
|
Exprimeo, FraGGo, 123-Emploi...
|
Editeur/Solution
|
Techno.
|
Suport 64 bits
|
Mode
|
Prix
|
Clients
|
Du point de vue du mode de founiture des solutions, le mode licence est majoritairement représenté (13 solutions sur 17) alors que seuls 3 éditeurs proposent uniquement un mode hébergé.
Enfin, la fourchette de tarification des solutions dans le cas du mode licence - avec support de toutes les langues - est comprise entre 12 000 et 62 500 euros, alors que celle du mode hébergé débute à partir des 30 euros par mois.
|