|
Expériences
/ Site
web |
Jeudi
13 juin 2002
|
Comment
AOL France a refondu son moteur de recherche
Sous la direction technique d'AOL France, ce projet s'est appuyé sur l'expertise de Cybion en matière d'annuaires et celle d'Exalead pour les technologies de recherche. -->
|
|
Spécial
Moteurs de recherche
|
|
Fin 2001, AOL
France, filiale française du fournisseur d'accès
à Internet du même nom, décide de
se lancer dans une refonte de son portail. Objectif affiché :
développer un site, ciblant l'Internet francophone,
qui offre une réelle alternative à l'annuaire
de Yahoo et au moteur de recherche de Google. Dans cette
refonte, la fonction recherche tient une place toute particulière.
" Il s'agit de la fonction la plus utilisée
par les abonnées d'AOL, explique Jocelyn Aubry,
directeur technique d'AOL France. A travers cette initiative,
notre objectif initial était de trouver une alternative
à l'outil que nous utilisions auparavant (Inktomi)...
en vue de renforcer à la fois le caractère intuitif
de notre solution de recherche et de notre annuaire."
Le
choix du moteur de recherche d'Exalead
AOL
France décide d'emblée de faire appel à
plusieurs prestataires afin de mettre au point les briques
de sa plate-
forme
relatives au traitement linguistique. Côté
outil de recherche, la filiale d'AOL opte pour la technologie
de recherche d'Exalead.
Parmi les raisons de ce choix,
Jocelyn Aubry cite les capacités de cette solution
à tenir la charge. "Elle supporte sans problème
plusieurs centaines de requêtes simultanées",
détaille t-il. Autre raison évoquée :
l'aptitude du moteur à accompagner la recherche
d'un utilisateur en lui proposant plusieurs expressions
affiner sa demande. "Au terme "pyramide",
il renverra par exemple les concepts de "pyramide
du Louvre", de "pyramide de Keops" et de
"métro pyramide", commente t-on chez
AOL France.
A la manière de Google, Exalead couple également
traitement linguistique et algorithme de popularité. Une
mécanique qui au final est conçue pour appeler
les centres d'intérêts les plus proches d'une requête
en sélectionnant dans l'index ceux qui auront été les
plus sollicités par les internautes précédents.
Délivré en mode hébergé, ce
produit permet à AOL d'indexer près de 50
millions de documents. "Au delà de sites Web
en français, il peut s'agir aussi de pages Web
dans d'autres langues qui abordent des thèmes ou
une actualité
susceptibles d'intéresser un visiteur francophone",
complète le directeur technique d'AOL France.
Référentiel XML reposant sur des métadonnées
RDF (Resource Description Framework), l'annuaire développé
dans le cadre du projet référence pour l'heure
près de 90 000 sites. Fruit d'un travail commun
entre le département informatique d'AOL et la société
Cybion, son déploiement a été accompagné
d'un travail de définition de règles relatives
à l'ensemble des actions de maintenance qu'il demande :
création de parties, inscription de nouvelles entrées,
etc.
Une architecture
faite maison
Prenant
également en compte les données de l'annuaire,
le moteur d'Exalead envoie régulièrement
à AOL France le résultat de ses collectes.
Lui aussi décrit au format XML, cet index (qui
inclut catégories, résumés de pages,
etc.) est ensuite associé à un module de
l'éditeur installé en local en vue de répondre
aux requêtes utilisateur. Entièrement
développée par le fournisseur d'accès
Internet (en C++) , la logique applicative du site gère
quant elle l'affichage des pages en y associant éventuellement
des contenus éditoriaux supplémentaires
(actualités, etc.) en fonction de la thématique
des demandes.
Laissant à Cybion le soin d'intégrer l'annuaire
à sa plate-forme, AOL France a choisi de prendre
en charge lui-même le déploiement de l'architecture
du site. Installé sur des machines Sun, ce dernier
tourne sous Netscape Enterprise Server. "Nous avons
retenu ce serveur Web car il sait gérer le multithreading,
ce qui n'était pas le cas d'Apache -jusqu'à
sa dernière version (2.0)", précise
Jocelyn Aubry. Quant au choix de la technologie Sun, elle
s'expliquerait avant tout par des besoins en haute disponibilité
ainsi qu'un bon niveau de compétences internes
autour des systèmes Unix et du langage Java. Les
différentes briques de l'application sont réparties
sur plusieurs serveurs. Dessinée pour être
redondante à tous les étages (routeurs,
pares feu, machines, applications, etc.), cette infrastructure
est équipée de fonctions d'équilibrage
de charge pour garantir les performances d'accès
au site.
Un
bilan qui semble plutôt positif
Lancé le 17 avril dernier, quel est le bilan d'exploitation
du site d'AOL France ? Côté technique,
les tests effectués sur l'architecture mettrait
en valeur des temps de réponses de moins de 10
millisecondes. Un résultat qui selon la société
serait semblable au chiffre affiché par Google.
"Selon une récente étude menée
par Abondance,
les utilisateurs débutants nous placent désormais
devant ce concurrent", argumente Jocelyn Aubry. Alors
qu'il entrait tout juste dans le baromètre 1ère
Position/Xiti des 10 premiers sites de recherche francophones
il y a six mois, le portail d'AOL est actuellement placé
à la cinquième place du benchmark de l'éditeur...
"Et Nous comptons figurer dans le groupe des trois
premiers d'ici la fin de l'année", promet
l'intéressé. A suivre
Google, le petit Poucet
En 1998, l'univers des moteurs de recherche et des
annuaires voyait débarquer un nouvel entrant : Google.
Un moteur qui au fil des années a atteint un degré
de notoriété à faire pâlir la plupart de ses concurrents.
Dernier épisode en date : en juin 2000, le
célèbre annuaire Yahoo
opte pour la plate-forme de la firme de Sergey Brin
comme moteur de recherche par défaut. Comment expliquer
aujourd'hui cette réussite fulgurante ? La recette
du petit Poucet des moteurs de recherche trouverait
sa source dans un dispositif associant un index
relativement classique à une méthode originale de
classement des réponses -qui passe schématiquement
par l'analyse du nombre et de la pertinence des
liens pointant vers les pages Web au regard de la
requête saisie. |
|
[Antoine Crochet Damais, JDNet]
|
|
|
|
|