Rechercher :         

Sociétés Prestataires Carnet Formations Progiciels Encyclo Fonds Guide d'achat Téléchargement
Chronique / C. Revelli

Voir la chronique précédente
Comment le "peer-to-peer" dévoile la face cachée du Web
par Carlo Revelli
[Fondateur d'AgentLand, pdg de Cybion]
          

Le concept du P2P ("peer to peer") est très à la mode depuis presque deux ans essentiellement grâce à Napster, le célèbre logiciel qui permet de partager et de trouver des fichiers MP3 sur Internet. Très vite, de nombreuses autres applications se basant sur la même approche ont vu le jour ces derniers mois. Grâce à ce type de technologies, les utilisateurs qui disposent d'un logiciel de type P2P peuvent se relier directement entre eux, souvent sans besoin d'un serveur central, de manière à pouvoir échanger librement les fichiers qu'ils souhaitent partager sur leurs disques durs. Jusqu'à cette date cette technologie a été utilisée dans deux optiques presque opposées :

- d'un côté on retrouve toutes ces applications "ludiques" qui favorisent le partage de musiques, de jeux, d'images ou de vidéos parfois piratés ou à caractère pornographique (Napster, Kazaa, Rapigator, Nudester, Imesh…)
- de l'autre côté, on a accès à des logiciels qui permettent de partager la puissance de calcul de votre ordinateur souvent pour des causes humanitaires ou dans une optique de recherche (Seti@Home permet de scruter la présence d'extraterrestres dans l'espace, FightAIDS@Home tente de lutter contre le sida et ComputeAgainstCancer contre le cancer).

Depuis quelques temps, la technologie P2P commence aussi à être appliquée à des problématiques de recherche d'informations. Trouver la bonne information a toujours été délicat sur Internet. La principale faiblesse des moteurs de recherche comme Google ou Altavista peut paraître paradoxale. En effet, alors que ces outils n'indexent qu'une partie infime des données réellement disponibles sur Internet, quand on les interroge ils nous restituent trop souvent une pléthore de réponses peu pertinentes. Puisque chaque jour se créent environ 10 millions de nouvelles pages web, il est clair qu'aucun serveur, aussi puissant soit-il, ne peut réussir à indexer efficacement autant de données. Sans même parler du web invisible "officiel", ces milliers des bases de données, de brevets ou autres archives qui en aucune manière ne peuvent être atteintes et indexées par les moteurs de recherche traditionnels (par exemple les archives du journal " Le Monde " ne peuvent pas être interrogées via Google mais uniquement en se rendant sur le site du Monde afin d'interroger la base de données locale). Certains agents de recherche comme Copernic ou BullsEye s'accommodent en partie de ce défaut en fonctionnant comme des méta-moteurs capables d'interroger plusieurs centaines de bases de données différentes. En les personnalisant finement, on peut parfois atteindre une partie bien délimitée de ce fameux web invisible " officiel ".

A la recherche du web "invisible et personnel"
Mais en plus des pages web " statiques " et du web invisible " officiel ", il existe un énorme gisement d'informations qui n'a jamais été pris en considération : les données qui sont sur nos ordinateurs personnels ! Il existe donc une partie du web encore plus cachée, occulte et souterraine : le "web invisible personnel". Certes, beaucoup des informations qui sont sur nos ordinateurs demeurent confidentielles et personne ne souhaite les partager. Mais d'autres données, comme par exemple certains de nos bookmarks (signets), peuvent être mises à disposition sur Internet afin de pouvoir optimiser les recherches d'autres utilisateurs. C'est le pari de la jeune société française Amoweba qui vient de lancer le logiciel Human-Links en partant du constat que beaucoup d'internautes capitalisent au sein de leurs bookmarks les fruits de leurs recherches sur Internet.

La logique de fonctionnement de Human-Links est assez simple et se déroule selon 3 étapes :
- D'abord, il faut importer dans le logiciel l'ensemble des adresses Internet que l'on souhaite partager (bookmarks).
- Ensuite, Human-Links analyse les pages web en question et les regroupe graphiquement en différents centres d'intérêt (création automatique de cartes qui représentent les différentes thématiques identifiées)
- Enfin, ce sont ces centres d'intérêt et ces profils qui sont partagés au sein de la communauté des utilisateurs afin de répondre à des requêtes bien précises

Ainsi, lors d'une requête d'un utilisateur, Human-Links va rechercher les différents ordinateurs disponibles afin d'identifier ceux qui possèdent vos mêmes centres d'intérêt et qui sont donc susceptibles de fournir la réponse à votre question. Il est intéressant de signaler que le logiciel fonctionne avec des pages web issues de n'importe quelle langue. En effet, l'approche choisie par Amoweba n'est pas sémantique (aucune création de dictionnaires ou de bases de connaissances) mais opère par identification de mots-clés. Par exemple, si en analysant différentes pages web, le logiciel détecte de manière récurrente des mots-clés comme zidane, juventus, uefa… il créera un thème autour du football. En important son bookmark dans Human-Links l'utilisateur arrive à visualiser graphiquement ses centres d'intérêt sous forme de cartes qu'il pourra ensuite partager avec les autres membres de la communauté.

Le P2P pour atteindre "la face cachée" du Web ?
Nous ne nous attarderons pas sur les quelques imperfections du logiciel lui-même. En effet, il s'agit d'une version beta qui, on l'espère, évoluera vite. En effet, à l'heure actuelle l'interface n'est pas encore complètement intuitive et ceci empêche d'exploiter efficacement l'ensemble des fonctionnalités de Human-Links. La version beta de ce logiciel vient d'être lancée gratuitement. Les fondateurs espèrent atteindre vite les 100 000 utilisateurs afin que les recherches deviennent de plus en plus pertinentes pour ensuite proposer les premières versions payantes. Un point qu'il faut signaler, propre à toute application P2P, c'est que Human-Links introduit obligatoirement une brèche potentielle dans l'ordinateur de chaque utilisateur. Amoweba devra communiquer beaucoup sur ce point pour rassurer les utilisateurs, notamment ceux susceptibles d'utiliser Human-Links à partir du bureau. Reste la question de fond : le " eer to peer" va-t-il révolutionner la recherche d'informations sur Internet ?

Difficile d'apporter une réponse définitive. Je partage en partie les doutes de certains spécialistes comme Danny Sullivan ou Olivier Andrieu. Je ne pense pas, en effet, que les logiciels P2P risquent d'inquiéter les grands outils de recherche. Les champs d'investigation ne sont pas les mêmes. Les moteurs comme Google, Altavista ou HotBot ont pour but de rechercher les informations disponibles sur le web visible (composé de pages statiques). Certains agents de recherche de type meta-moteurs (Copernic, DigOut4U, Bullseye) permettent "d'attaquer" une partie du web invisible notamment par le biais de milliers de base de données officielles (pages dynamiques). Enfin, les logiciels P2P ont pour but d'atteindre la partie la plus cachée du web, celle composée de millions d'ordinateurs reliés entre eux, appartenant à des personnes désireuses de rechercher et partager leurs ressources personnelles (bookmarks, mp3, vidéos, logiciels et naturellement aussi virus…).

A l'heure actuelle, il n'existe pas un réel antagonisme entre ces trois approches mais plutôt une vraie complémentarité. Internet se compose d'une multitude de " sphères "(pages web statiques, web invisible, bases de données, pages personnelles, forums de discussions…) et aucun outil de recherche ne permet, pour l'instant, de les interroger simultanément de manière efficace.


Sur le site AgentLand.fr vous pourrez:

- Découvrir les didacticiels et les articles sur les agents intelligents
- Accéder, grâce à l'annuaire, à plusieurs milliers de sites sur les agents
- Télécharger gratuitement plus de 600 agents dans le download center
- Partager vos opinions au sein de la communauté des agents
- Personnaliser et échanger vos agents



Gratuit - L'actualité des technologies
e-business

Toutes nos newsletters
 
 
 
 
 
 
Logiciels libres
Retours d'expérience, panorama, analyses.
Sommaire
 
Failles de sécurité
Vulnérabilités des logiciels & évaluation des risques.
Sommaire
 
 

Les entreprises de l'Internet
Plus de 5000 sociétés référencées

Les prestataires
Plus de 2600 prestataires

Les fonds
Plus de 100 fiches descriptives

Le carnet des managers Internet
Plus de 1500 dirigeants

Guide des solutions
Plus de 310 briques logicielles