Le concept
du P2P
("peer to peer") est très à la mode depuis presque deux
ans essentiellement grâce à Napster, le célèbre logiciel qui
permet de partager et de trouver des fichiers MP3 sur Internet.
Très vite, de nombreuses autres applications se basant sur
la même approche ont vu le jour ces derniers mois. Grâce à
ce type de technologies, les utilisateurs qui disposent d'un
logiciel de type P2P peuvent se relier directement entre eux,
souvent sans besoin d'un serveur central, de manière à pouvoir
échanger librement les fichiers qu'ils souhaitent partager
sur leurs disques durs. Jusqu'à cette date cette technologie
a été utilisée dans deux optiques presque opposées :
- d'un côté on retrouve toutes ces applications "ludiques"
qui favorisent le partage de musiques, de jeux, d'images ou
de vidéos parfois piratés ou à caractère pornographique (Napster,
Kazaa, Rapigator, Nudester, Imesh
)
- de l'autre côté, on a accès à des logiciels qui permettent
de partager la puissance de calcul de votre ordinateur
souvent pour des causes humanitaires ou dans une optique de
recherche (Seti@Home permet de scruter la présence d'extraterrestres
dans l'espace, FightAIDS@Home tente de lutter contre le sida
et ComputeAgainstCancer contre le cancer).
Depuis quelques temps, la technologie P2P commence aussi à
être appliquée à des problématiques de recherche d'informations.
Trouver la bonne information a toujours été délicat sur Internet.
La principale faiblesse des moteurs de recherche comme Google
ou Altavista peut paraître paradoxale. En effet, alors que
ces outils n'indexent qu'une partie infime des données réellement
disponibles sur Internet, quand on les interroge ils nous
restituent trop souvent une pléthore de réponses peu pertinentes.
Puisque chaque jour se créent environ 10 millions de nouvelles
pages web, il est clair qu'aucun serveur, aussi puissant soit-il,
ne peut réussir à indexer efficacement autant de données.
Sans même parler du web invisible "officiel", ces milliers
des bases de données, de brevets ou autres archives qui en
aucune manière ne peuvent être atteintes et indexées par les
moteurs de recherche traditionnels (par exemple les archives
du journal " Le Monde " ne peuvent pas être interrogées via
Google mais uniquement en se rendant sur le site du Monde
afin d'interroger la base de données locale). Certains agents
de recherche comme Copernic ou BullsEye s'accommodent en partie
de ce défaut en fonctionnant comme des méta-moteurs capables
d'interroger plusieurs centaines de bases de données différentes.
En les personnalisant finement, on peut parfois atteindre
une partie bien délimitée de ce fameux web invisible " officiel
".
A
la recherche du web "invisible et personnel"
Mais en
plus des pages web " statiques " et du web invisible " officiel
", il existe un énorme gisement d'informations qui n'a jamais
été pris en considération : les données qui sont sur nos ordinateurs
personnels ! Il existe donc une partie du web encore plus
cachée, occulte et souterraine : le "web invisible personnel".
Certes, beaucoup des informations qui sont sur nos ordinateurs
demeurent confidentielles et personne ne souhaite les partager.
Mais d'autres données, comme par exemple certains de nos bookmarks
(signets), peuvent être mises à disposition sur Internet afin
de pouvoir optimiser les recherches d'autres utilisateurs.
C'est le pari de la jeune société française Amoweba
qui vient de lancer le logiciel Human-Links en partant du
constat que beaucoup d'internautes capitalisent au sein de
leurs bookmarks les fruits de leurs recherches sur Internet.
La logique de fonctionnement de Human-Links est assez simple
et se déroule selon 3 étapes :
- D'abord, il faut importer dans le logiciel l'ensemble
des adresses Internet que l'on souhaite partager (bookmarks).
- Ensuite, Human-Links analyse les pages web en question
et les regroupe graphiquement en différents centres d'intérêt
(création automatique de cartes qui représentent les différentes
thématiques identifiées)
- Enfin, ce sont ces centres d'intérêt et ces profils qui
sont partagés au sein de la communauté des utilisateurs
afin de répondre à des requêtes bien précises
Ainsi, lors d'une requête d'un utilisateur, Human-Links va
rechercher les différents ordinateurs disponibles afin d'identifier
ceux qui possèdent vos mêmes centres d'intérêt et qui sont
donc susceptibles de fournir la réponse à votre question.
Il est intéressant de signaler que le logiciel fonctionne
avec des pages web issues de n'importe quelle langue. En effet,
l'approche choisie par Amoweba n'est pas sémantique (aucune
création de dictionnaires ou de bases de connaissances) mais
opère par identification de mots-clés. Par exemple, si en
analysant différentes pages web, le logiciel détecte de manière
récurrente des mots-clés comme zidane, juventus, uefa
il
créera un thème autour du football. En important son bookmark
dans Human-Links l'utilisateur arrive à visualiser graphiquement
ses centres d'intérêt sous forme de cartes qu'il pourra ensuite
partager avec les autres membres de la communauté.
Le
P2P pour atteindre "la face cachée" du Web
?
Nous ne
nous attarderons pas sur les quelques imperfections du logiciel
lui-même. En effet, il s'agit d'une version beta qui, on l'espère,
évoluera vite. En effet, à l'heure actuelle l'interface n'est
pas encore complètement intuitive et ceci empêche d'exploiter
efficacement l'ensemble des fonctionnalités de Human-Links.
La version beta de ce logiciel vient d'être lancée gratuitement.
Les fondateurs espèrent atteindre vite les 100 000 utilisateurs
afin que les recherches deviennent de plus en plus pertinentes
pour ensuite proposer les premières versions payantes. Un
point qu'il faut signaler, propre à toute application P2P,
c'est que Human-Links introduit obligatoirement une brèche
potentielle dans l'ordinateur de chaque utilisateur. Amoweba
devra communiquer beaucoup sur ce point pour rassurer les
utilisateurs, notamment ceux susceptibles d'utiliser Human-Links
à partir du bureau. Reste la question de fond : le " eer to
peer" va-t-il révolutionner la recherche d'informations sur
Internet ?
Difficile d'apporter une réponse définitive. Je partage en
partie les doutes de certains spécialistes comme Danny
Sullivan ou Olivier
Andrieu. Je ne pense pas, en effet, que les logiciels
P2P risquent d'inquiéter les grands outils de recherche. Les
champs d'investigation ne sont pas les mêmes. Les moteurs
comme Google, Altavista ou HotBot ont pour but de rechercher
les informations disponibles sur le web visible (composé de
pages statiques). Certains agents de recherche de type meta-moteurs
(Copernic, DigOut4U, Bullseye) permettent "d'attaquer" une
partie du web invisible notamment par le biais de milliers
de base de données officielles (pages dynamiques). Enfin,
les logiciels P2P ont pour but d'atteindre la partie la plus
cachée du web, celle composée de millions d'ordinateurs reliés
entre eux, appartenant à des personnes désireuses de rechercher
et partager leurs ressources personnelles (bookmarks, mp3,
vidéos, logiciels et naturellement aussi virus
).
A l'heure actuelle, il n'existe pas un réel antagonisme entre
ces trois approches mais plutôt une vraie complémentarité.
Internet se compose d'une multitude de " sphères "(pages web
statiques, web invisible, bases de données, pages personnelles,
forums de discussions
) et aucun outil de recherche ne permet,
pour l'instant, de les interroger simultanément de manière
efficace.
|