Rechercher :         

Sociétés Prestataires Carnet Formations Progiciels Encyclo Fonds Guide d'achat Téléchargement
Expériences / Site web
Jeudi 13 juin 2002
Comment AOL France a refondu son moteur de recherche Sous la direction technique d'AOL France, ce projet s'est appuyé sur l'expertise de Cybion en matière d'annuaires et celle d'Exalead pour les technologies de recherche. -->
          
Spécial Moteurs de recherche
Fin 2001, AOL France, filiale française du fournisseur d'accès à Internet du même nom, décide de se lancer dans une refonte de son portail. Objectif affiché : développer un site, ciblant l'Internet francophone, qui offre une réelle alternative à l'annuaire de Yahoo et au moteur de recherche de Google. Dans cette refonte, la fonction recherche tient une place toute particulière. " Il s'agit de la fonction la plus utilisée par les abonnées d'AOL, explique Jocelyn Aubry, directeur technique d'AOL France. A travers cette initiative, notre objectif initial était de trouver une alternative à l'outil que nous utilisions auparavant (Inktomi)... en vue de renforcer à la fois le caractère intuitif de notre solution de recherche et de notre annuaire."

Le choix du moteur de recherche d'Exalead
AOL France décide d'emblée de faire appel à plusieurs prestataires afin de mettre au point les briques de sa plate-
forme relatives au traitement linguistique. Côté outil de recherche, la filiale d'AOL opte pour la technologie de recherche d'Exalead. Parmi les raisons de ce choix, Jocelyn Aubry cite les capacités de cette solution à tenir la charge. "Elle supporte sans problème plusieurs centaines de requêtes simultanées", détaille t-il. Autre raison évoquée : l'aptitude du moteur à accompagner la recherche d'un utilisateur en lui proposant plusieurs expressions affiner sa demande. "Au terme "pyramide", il renverra par exemple les concepts de "pyramide du Louvre", de "pyramide de Keops" et de "métro pyramide", commente t-on chez AOL France.

A la manière de Google, Exalead couple également traitement linguistique et algorithme de popularité. Une mécanique qui au final est conçue pour appeler les centres d'intérêts les plus proches d'une requête en sélectionnant dans l'index ceux qui auront été les plus sollicités par les internautes précédents. Délivré en mode hébergé, ce produit permet à AOL d'indexer près de 50 millions de documents. "Au delà de sites Web en français, il peut s'agir aussi de pages Web dans d'autres langues qui abordent des thèmes ou une actualité susceptibles d'intéresser un visiteur francophone", complète le directeur technique d'AOL France.

Référentiel XML reposant sur des métadonnées RDF (Resource Description Framework), l'annuaire développé dans le cadre du projet référence pour l'heure près de 90 000 sites. Fruit d'un travail commun entre le département informatique d'AOL et la société Cybion, son déploiement a été accompagné d'un travail de définition de règles relatives à l'ensemble des actions de maintenance qu'il demande : création de parties, inscription de nouvelles entrées, etc.

Une architecture faite maison
Prenant également en compte les données de l'annuaire, le moteur d'Exalead envoie régulièrement à AOL France le résultat de ses collectes. Lui aussi décrit au format XML, cet index (qui inclut catégories, résumés de pages, etc.) est ensuite associé à un module de l'éditeur installé en local en vue de répondre aux requêtes utilisateur. Entièrement développée par le fournisseur d'accès Internet (en C++) , la logique applicative du site gère quant elle l'affichage des pages en y associant éventuellement des contenus éditoriaux supplémentaires (actualités, etc.) en fonction de la thématique des demandes.

Laissant à Cybion le soin d'intégrer l'annuaire à sa plate-forme, AOL France a choisi de prendre en charge lui-même le déploiement de l'architecture du site. Installé sur des machines Sun, ce dernier tourne sous Netscape Enterprise Server. "Nous avons retenu ce serveur Web car il sait gérer le multithreading, ce qui n'était pas le cas d'Apache -jusqu'à sa dernière version (2.0)", précise Jocelyn Aubry. Quant au choix de la technologie Sun, elle s'expliquerait avant tout par des besoins en haute disponibilité ainsi qu'un bon niveau de compétences internes autour des systèmes Unix et du langage Java. Les différentes briques de l'application sont réparties sur plusieurs serveurs. Dessinée pour être redondante à tous les étages (routeurs, pares feu, machines, applications, etc.), cette infrastructure est équipée de fonctions d'équilibrage de charge pour garantir les performances d'accès au site.

Un bilan qui semble plutôt positif
Lancé le 17 avril dernier, quel est le bilan d'exploitation du site d'AOL France ? Côté technique, les tests effectués sur l'architecture mettrait en valeur des temps de réponses de moins de 10 millisecondes. Un résultat qui selon la société serait semblable au chiffre affiché par Google. "Selon une récente étude menée par Abondance, les utilisateurs débutants nous placent désormais devant ce concurrent", argumente Jocelyn Aubry. Alors qu'il entrait tout juste dans le baromètre 1ère Position/Xiti des 10 premiers sites de recherche francophones il y a six mois, le portail d'AOL est actuellement placé à la cinquième place du benchmark de l'éditeur... "Et Nous comptons figurer dans le groupe des trois premiers d'ici la fin de l'année", promet l'intéressé. A suivre

Google, le petit Poucet

En 1998, l'univers des moteurs de recherche et des annuaires voyait débarquer un nouvel entrant : Google. Un moteur qui au fil des années a atteint un degré de notoriété à faire pâlir la plupart de ses concurrents. Dernier épisode en date : en juin 2000, le célèbre annuaire Yahoo opte pour la plate-forme de la firme de Sergey Brin comme moteur de recherche par défaut. Comment expliquer aujourd'hui cette réussite fulgurante ? La recette du petit Poucet des moteurs de recherche trouverait sa source dans un dispositif associant un index relativement classique à une méthode originale de classement des réponses -qui passe schématiquement par l'analyse du nombre et de la pertinence des liens pointant vers les pages Web au regard de la requête saisie.

[Antoine Crochet Damais, JDNet]

Au sommaire de l'actualité

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY



Gratuit - L'actualité des technologies
e-business

Toutes nos newsletters
 
 
 
 
 
 
Logiciels libres
Retours d'expérience, panorama, analyses.
Sommaire
 
Failles de sécurité
Vulnérabilités des logiciels & évaluation des risques.
Sommaire
 
 

Les entreprises de l'Internet
Plus de 5000 sociétés référencées

Les prestataires
Plus de 2600 prestataires

Les fonds
Plus de 100 fiches descriptives

Le carnet des managers Internet
Plus de 1500 dirigeants

Guide des solutions
Plus de 310 briques logicielles