Avec
Olivier Andrieu, responsable du site Abondance
DirectHit, l'espion des moteurs - 18 août 2000 -
Les outils de
recherche sont continuellement en quête de nouvelles approches
pour parvenir à fournir des résultats pertinents à des requêtes
qui ne le sont pas toujours. Parmi ces nouvelles technologies,
l'indice de clic, inventé par la société DirectHit, n'est
pas la moins intéressante. Le fait qu'elle soit aujourd'hui
copiée et intégrée par de nombreux moteurs montre bien son
intérêt...
Les moteurs
de recherche comme AltaVista, Lycos ou Google effectuent,
de façon classique, leurs investigations en texte intégral
dans leurs index composés de plusieurs centaines de millions
de pages Web. Le système de classement des résultats est le
plus souvent proche d'un outil à l'autre : présence du mot
demandé dans le titre de la page, dans le texte visible, dans
les balises META, etc.
Difficile
d'innover dans ce domaine ? Pas si sûr... Le système d'indice
de clic imaginé il y a quelques mois par Direct Hit entre
en jeu et commence à révolutionner les algorithmes de classement
des moteurs. Pour bien comprendre comment il fonctionne, analysons
le comportement "classique" d'un internaute devant un moteur
de recherche : il va sur la page d'accueil, saisit un ou plusieurs
mots dans un formulaire, consulte la page de résultats proposée
(sur laquelle plusieurs liens sont indiqués, classés par ordre
de pertinence), il choisit l'un d'entre eux, va sur le site
correspondant, le consulte. Si cette page ne lui convient
pas, il revient sur la page de résultats du moteur (par le
bouton "précédent" du navigateur), choisit un autre lien parmi
ceux proposés, etc. jusqu'à ce qu'il ait trouvé son bonheur.
DirectHit
va, en fait, profiter de cet aspect comportemental de l'internaute
pour tenter de trouver les pages les plus "populaires", c'est-à-dire
le plus souvent cliquées, sur un moteur de recherche et ainsi
améliorer leur classement. Il fonctionne, en règle générale,
en tâche de fond sur un moteur existant. A chaque consultation
d'un internaute, il va noter sur quel lien il a cliqué et
quel était le rang (le classement) de ce lien. Il calcule
ensuite combien de temps l'utilisateur met avant de revenir
sur la page de résultats. Si il ne revient pas, il en "déduit"
que le site proposé était a priori pertinent. Son adresse
sera alors mieux classée dans les résultats suivants, lors
d'une interrogation sur le même mot clé. Et ainsi de suite,
les interrogations et la façon d'interroger et de naviguer
des internautes vont alors enrichir la base de données de
DirectHit.
Ce système,
très ingénieux même s'il pénalise fortement les pages récentes
(tout comme l'indice de popularité que nous verrons prochainement)
et qui ne peut bien entendu être utilisé comme critère de
pertinence unique, fonctionne sur de nombreux outils de recherche,
comme Ask Jeeves (qui a racheté la technologie DirectHit il
y a peu), MSN ou Lycos. Il est également disponible sous la
forme d'une barre d'outils que l'on peut joindre à son logiciel
de navigation (sur PC uniquement). Il a d'ailleurs, depuis
sa création, été largement copié et un système similaire fonctionne,
par exemple, sur Inktomi ou Altavista.
DirectHit
est le seul système qui tienne compte, pour le classement
des pages qu'il propose, du comportement "humain" de l'internaute.
De plus, et ce n'est pas négligeable, il est très complexe
à "spammer" (obtenir par une technique quelconque - assimilée
à une fraude - un meilleur positionnement sur le moteur de
recherche). C'est pour cela que les moteurs utilisent de plus
en plus largement ce concept, qui est sans conteste appelé
à un bel avenir. [Olivier Andrieu, Abondance]
Au sommaire
de l'actualité
|
|