Le peer-to-peer adapté
à la recherche d'information
- Vendredi 20 juillet 2001 -

Dans la foulée des projets Pointera et Pandango, les sociétés Amoweba et Altavista viennent, coup sur coup , de lancer deux produits adaptant le concept du peer-to-peer, popularisé par Napster, à la recherche d'information sur le Web. Bonne idée ou coup d'épée dans l'eau ? Difficile à dire pour l'instant...

Liens

Altavista Search Engine Software 3.0

Human Links

Pandango

Pointera

Les nouvelles orientations sont nombreuses dans le domaine des outils de recherche. L'une des plus originales est celle du partage de fichiers entre utilisateurs, qui se base sur les principes -très décriés parfois- de Napster, recherchant l'information dans un index "classique" mais également sur les disques durs de la communauté d'utilisateurs. Vous avez certainement déjà entendu parler du logciel Napster (il faudrait sourd et aveugle) : il permet l'échange de morceaux de musique, disponibles au format MP3, en effectuant des recherches sur les disques durs des personnes connectées, partageant leurs ressources sur l'Internet, chaque machine devenant ainsi une portion de la masse d'information disponible en ligne, une partie parfois infime d'une immense base de donnée à l'échelle planétaire.

Il n'en fallait pas moins aux concepteurs de moteurs de recherche pour imaginer un système identique adapté à la recherche d'information sur le Web. Le but est donc de lancer non seulement une requête sur un index de document, de façon tout à fait classique, comme pourrait le faire un Altavista, un Voila ou un Lycos, mais également de poursuivre cette recherche sur les espaces qui auront été au préalable déclarés "ouverts à tous" sur les disques durs des internautes connectés à ce moment-là.

Plusieurs projets ont
vu le jour

Ainsi est né le projet Pointera, il y a quelques mois de cela. Puis celui connu sous le nom de code Pandango. L'outil tente d'établir son algorithme de pertinence sur l'historique des navigations de très nombreux internautes sur le Web. Le but est d'examiner les habitudes de navigation de milliers d'utilisateurs d'Internet mis en réseau pour en retenir des "leçons" qui pourraient aider à identifier par la suite l'information la plus pertinente sur une requête donnée. D'autres projets similaires ont par la suite été mis en oeuvre. Dernièrement, le peer-to-peer (P2P) est revenu dans les feux de l'actualité de la recherche d'info sur le Web avec la jeune société Amoweba qui propose en version beta un outil nommé Human Links. La société a ainsi "recruté" 100.000 bêta-testeurs âgés de 18 à 35 ans pour tester son système. Là aussi, l'objectif est de partager les connaissances et les sites favoris des internautes qui l'utilisent en cartographiant les bookmarks (favoris) de la communauté sur le thème recherché.

Nouvel acteur dans le domaine du peer-to-peer également, Altavista propose, de son côté, depuis peu un nouvel outil de recherche étudié pour le marché professionnel et basé sur son offre "Altavista Search Engine Software 3.0". Il permet d'effectuer des recherches sur plusieurs sites Web (par exemple, tous les sites Internet et intranet d'une même entreprise) mais également sur d'autres formats comme les e-mails ou les ordinateurs portables de type PDA ou tout simplement les machines de bureau du personnel. Bref, le système part du principe que l'information, au sein de l'entreprise, est disponible sous des formats souvent très différents et disséminée sur de nombreux supports. Le nouvel outil tente donc d'effectuer des recherches dans cet univers hétérogène pour synthétiser les données récoltées en mettant en place un système de P2P prenant en compte toutes les machines de l'entreprise.

Pouvoir balayer tous les types de formats

Altavista estime, en effet, que 75% des informations utiles à l'entreprises sont disponibles sous des formats qui étaient jusqu'à aujourd'hui difficilement indexables (bases de données, tableur). Le nouveau logiciel tente de combler ce manque en comprenant 200 formats et 30 langages différents. Ceci dit, de nombreuses voix, sur l'Internet, se sont élèvées pour dénoncer l'aspect trop intrusif de l'outil qui permettrait d'aller effectuer des recherches sur le contenu des e-mails reçus par les employés et sur les disques durs de leurs ordinateurs. On voit tout de suite les dérives possibles et le spectre de Big Brother revient à l'esprit de beaucoup... Altavista répond à ces critiques que l'outil prévoit des "gardes-fous" pour éviter tout débordement.

Bien sûr, toutes ces idées sont intéressantes et tous ces projets sont porteurs d'espoir. Les nouvelles voies d'exploration dans le domaine de la recherche d'information ne sont pas légion, aussi faut-il les encourager. Le jour où tous les ordinateurs du monde... Cependant, le système se heurte quand même à quelques écueils. Le problème du Web actuel n'est pas quantitatif (il existe des milliards de pages et des millions de sites en ligne), mais qualitatif. Il ne s'agit pas aujourd'hui de trouver beaucoup d'information "tous azimuths" de façon quasi exhaustive, mais peu d'information très pertinente. Multiplier la taille de la base de recherche par plusieurs dizaines va-t-il résoudre ce problème ? Ne va-t-il pas au contraire le maximiser ? En revanche, ces projets peuvent avoir une extraordinaire utilité à l'intérieur d'une communauté : par exemple, tous les programmeurs PHP pourraient créer une énorme base de données de favoris et de fichiers, des photographes pourraient mettre en place en quelques instants une énorme banque de données d'images et de sources d'information. Et ce ne sont là que quelques exemples...

Quelques défauts cependant...

Autre écueil : le système est basé sur l'échange de fichiers. Les internautes sont-ils prêts, notamment en France (où l'idée du shareware -"utilisez ce logiciel et payez-le uniquement si vous l'aimez"- fait parfois sourire), à coopérer au moteur en partageant leurs données ? Pas si sûr... S'ajoutent en outre tous les problèmes de sécurité que cela peut poser : aimeriez-vous que quelqu'un vienne fouiller sur votre disque dur, même à distance et même si vous lui avez donné l'autorisation d'aller dans certains répertoires uniquement ?

En résumé, si ces projets semblent complexes à mettre en oeuvre, il est important de voir à quelles solutions ils aboutissent, car il se pourrait qu'il en sorte des solutions de recherche particulièrement intéressantes. Peut-être pas obligatoirement sur leurs créneaux initiaux. On peut notamment penser que ces outils sont mieux conçus pour des intranets ou des communautés d'utilisateurs. Mais qu'importe, les voies de l'innovation sont parfois impénétrables. Bonne chance à tous donc !

[Olivier Andrieu, Abondance]

Sur le site Abondance, retrouvez :
 
- Une interface de vérification et de soumission sur les outils de recherche du web.
- L'annuaire des outils de recherche régionaux, de l'Alsace aux Dom-Tom.
- De nombreux articles sur la recherche d'information et le référencement.
La lettre d'information
hebdomadaire gratuite
du site Abondance

(plus d'info)


A lire également :

le sommaire de la rubrique

Au sommaire de l'actualité



 
 

Dossiers

Marketing viral

Comment transformer l'internaute en vecteur de promotion ? Dossier

Ergonomie

Meilleures pratiques et analyses de sites. Dossier

Annuaires

Sociétés high-tech

Plus de 10 000 entreprises de l'Internet et des NTIC. Dossier

Prestataires

Plus de 5 500 prestataires dans les NTIC. Dossier

Tous les annuaires
 
 

Sondage

Ce qui vous a le plus embêté avec le bug de Google :

Tous les sondages