Après
la commercialisation en mode ASP (application hébergée)
de divers outils de recherche personnalisables ciblant
les problématiques de sites Web ou de portails, Google
vient d'annoncer le lancement d'une solution destinée
aux environnements intranet
Baptisé Google Search Appliance,
le nouveau produit se présente sous la forme d'un
serveur machine s'appuyant directement sur la technologie
de recherche du fameux moteur.
La
technologie Google embarquée dans un boîtier
Basé sur un processeur
Pentium III 1GHz, le boîtier -qui
affiche 2 Go de mémoire vive et 80 Go de disque
dur- est livré avec un modem destiné aux accès administrateur.
Tournant sur un noyau Linux, l'interface cliente et
le moteur d'indexation sont accessibles par le biais
d'un serveur Web. Capable de prendre en charge près
d'une trentaine de langues (y compris certaines langues
asiatiques, telle que le chinois ou le japonais), l'application
pourrait supporter 200 types de fichiers différents
-parmi lesquels figurent documents HTML et PDF, ainsi
que les formats relatifs aux suites Microsoft Office
et Lotus Notes. Scannant corps de textes et meta-données,
l'indexeur se connecte à la fois aux serveurs
de proxy, et aux serveurs Web -en s'appuyant notamment
sur les protocoles HTTP et HTTPS.
Un moteur
qui analyse la structure des sites Web
Google
Search Appliance intègre un serveur de cache
pour stocker en local les documents qu'il aura indexés.
Pour classer les réponses possibles, il commence
par déterminer les pages Web les plus pertinentes en
se basant notamment sur l'analyse de la structure du
ou des sites sous-jacents. Puis, il applique divers
algorithmes afin de comparer la répétition et l'espacement
des termes contenus dans la requête avec ceux des documents
répertoriés par l'index. Ce calcul effectué,
divers systèmes interviennent pour paramétrer
le classement final (par date, etc.) ou encore surligner
le contenu des fichiers en fonction de la requête saisie
par l'utilisateur. Permettant d'accéder aux statistiques
de résultats (mots clefs, etc.), une interface d'administration
repère pour finir les éventuelles erreurs (serveurs
indisponibles, etc.) ainsi que l'évolution des contenus.
D'ores et déjà distribué aux États-Unis et au
Canada, Google Search Appliance devrait être prochainement
disponible en France.
|