Comment AOL
France a refondu son moteur de recherche
Par le JDNet
Solutions (Benchmark Group)
URL : http://www.journaldunet.com/solutions/0206/020613_aol.shtml
Jeudi 13 juin 2002
Fin
2001, AOL France,
filiale française du fournisseur d'accès à Internet
du même nom, décide de se lancer dans une refonte de
son portail . Objectif affiché : développer un
site, ciblant l'Internet francophone, qui offre une réelle
alternative à l'annuaire de Yahoo et au moteur de recherche
de Google. Dans cette refonte, la fonction recherche tient une place
toute particulière. " Il s'agit de la fonction la plus
utilisée par les abonnées d'AOL, explique Jocelyn Aubry,
directeur technique d'AOL France. A travers cette initiative, notre
objectif initial était de trouver une alternative à
l'outil que nous utilisions auparavant (Inktomi)...
en vue de renforcer à la fois le caractère intuitif de notre
solution de recherche et de notre annuaire."
Le
choix du moteur de recherche d'Exalead
AOL
France décide d'emblée de faire appel à plusieurs
prestataires afin de mettre au point les briques de sa plate-
forme
relatives au traitement linguistique. Côté outil de recherche,
la filiale d'AOL opte pour la technologie de recherche d'Exalead.
Parmi les raisons de ce choix, Jocelyn
Aubry cite les capacités de cette solution à tenir la
charge. "Elle supporte sans problème plusieurs centaines
de requêtes simultanées", détaille t-il.
Autre raison évoquée : l'aptitude du moteur à
accompagner la recherche d'un utilisateur en lui proposant plusieurs
expressions affiner sa demande. "Au terme "pyramide",
il renverra par exemple les concepts de "pyramide du Louvre",
de "pyramide de Keops" et de "métro pyramide",
commente t-on chez AOL France.
A la manière de Google, Exalead couple également traitement
linguistique et algorithme de popularité. Une mécanique qui
au final est conçue pour appeler les centres d'intérêts les
plus proches d'une requête en sélectionnant dans l'index ceux
qui auront été les plus sollicités par les internautes précédents.
Délivré en mode hébergé, ce produit permet
à AOL d'indexer près de 50 millions de documents. "Au
delà de sites Web en français, il peut s'agir aussi
de pages Web dans d'autres langues qui abordent des thèmes
ou une actualité susceptibles
d'intéresser un visiteur francophone", complète
le directeur technique d'AOL France.
Référentiel XML reposant sur des métadonnées
RDF (Resource Description Framework), l'annuaire développé
dans le cadre du projet référence pour l'heure près
de 90 000 sites. Fruit d'un travail commun entre le département
informatique d'AOL et la société Cybion, son déploiement
a été accompagné d'un travail de définition
de règles relatives à l'ensemble des actions de maintenance
qu'il demande : création de parties, inscription de nouvelles
entrées, etc.
Une architecture faite
maison
Prenant
également en compte les données de l'annuaire, le moteur
d'Exalead envoie régulièrement à AOL France le
résultat de ses collectes. Lui aussi décrit au format
XML, cet index (qui inclut catégories, résumés
de pages, etc.) est ensuite associé à un module de l'éditeur
installé en local en vue de répondre aux requêtes
utilisateur. Entièrement
développée par le fournisseur d'accès Internet
(en C++) , la logique applicative du site gère quant elle l'affichage
des pages en y associant éventuellement des contenus éditoriaux
supplémentaires (actualités, etc.) en fonction de la
thématique des demandes.
Laissant à Cybion le soin d'intégrer l'annuaire à
sa plate-forme, AOL France a choisi de prendre en charge lui-même
le déploiement de l'architecture du site. Installé sur
des machines Sun, ce dernier tourne sous Netscape Enterprise Server.
"Nous avons retenu ce serveur Web car il sait gérer le
multithreading, ce qui n'était pas le cas d'Apache -jusqu'à
sa dernière version (2.0)", précise Jocelyn Aubry.
Quant au choix de la technologie Sun, elle s'expliquerait avant tout
par des besoins en haute disponibilité ainsi qu'un bon niveau
de compétences internes autour des systèmes Unix et
du langage Java. Les différentes briques de l'application sont
réparties sur plusieurs serveurs. Dessinée pour être
redondante à tous les étages (routeurs, pares feu, machines,
applications, etc.), cette infrastructure est équipée
de fonctions d'équilibrage de charge pour garantir les performances
d'accès au site.
Un
bilan qui semble plutôt positif
Lancé le 17 avril dernier, quel est le bilan d'exploitation
du site d'AOL France ? Côté technique, les tests
effectués sur l'architecture mettrait en valeur des temps de
réponses de moins de 10 millisecondes. Un résultat qui
selon la société serait semblable au chiffre affiché
par Google. "Selon une récente étude menée
par Abondance,
les utilisateurs débutants nous placent désormais devant
ce concurrent", argumente Jocelyn Aubry. Alors qu'il entrait
tout juste dans le baromètre 1ère
Position/Xiti des 10 premiers sites de recherche francophones
il y a six mois, le portail d'AOL est actuellement placé à
la cinquième place du benchmark de l'éditeur... "Et
Nous comptons figurer dans le groupe des trois premiers d'ici la fin
de l'année", promet l'intéressé. A suivre
Google, le petit Poucet
En 1998, l'univers des moteurs de recherche et des annuaires
voyait débarquer un nouvel entrant : Google.
Un moteur qui au fil des années a atteint un degré de notoriété
à faire pâlir la plupart de ses concurrents. Dernier épisode
en date : en juin 2000, le célèbre annuaire Yahoo
opte pour la plate-forme de la firme de Sergey Brin comme moteur
de recherche par défaut. Comment expliquer aujourd'hui cette
réussite fulgurante ? La recette du petit Poucet des moteurs
de recherche trouverait sa source dans un dispositif associant
un index relativement classique à une méthode originale de classement
des réponses -qui passe schématiquement par l'analyse du nombre
et de la pertinence des liens pointant vers les pages Web au
regard de la requête saisie. |
[Antoine Crochet Damais, JDNet]
Pour tout problème de consultation, écrivez au Webmaster
Copyrights
et reproductions . Données
personnelles
Copyright 2006 Benchmark Group - 69-71 avenue Pierre Grenier
92517 Boulogne Billancourt Cedex, FRANCE
|
|
|