La puissance technologique du moteur de recherche
Google (qui affiche 2 milliards de pages Web indexées) commence à
exaspérer certains éditeurs médias. Dans un article
de son édition du 9 juillet, Cnet relatait le cas du site du New
York Times.Une porte-parole de New York Times Digital (la division Internet
du groupe de presse américain) signalait des problèmes avec
les résultats obtenus par les internautes à travers le cache
du moteur de recherche. Un système qui permet aux internautes de
passer outre l'entrée officielle dédiée aux archives
en ligne du journal et d'accéder directement à l'article voulu.
Une brèche qui devient gênante à partir du moment où
un éditeur décide de commercialiser d'une façon ou
d'une autre son fonds d'archives. NYtimes.com demande par exemple à
ses visiteurs une inscription au préalable avant d'accéder
aux archives du journal en ligne.
La
polémique concerne plus particulièrement la fonctionnalité
"Pages cachées" de Google. Il permet au moteur de recherche
de créer une copie de chaque page examinée sur le Web et de la
stocker dans une mémoire cache. Lorsque vous cliquez sur le lien Copie
cachée d'une page Web, Google affiche celle-ci dans l'état où elle se
trouvait lors de son indexation la plus récente. Une technique d'indexation
qui frôle la violation des droits d'auteurs sur Internet selon certains
experts et qui peut se révéler gênante lorsqu'un éditeur
en ligne décide de faire passer un article dans sa base de données
archives en accès payant. Pour le cas de NYTimes.com, la porte-parole
indique que la division Internet est "en train de régler ce
problème avec Google". Le but étant de parvenir à
un moyen de re-diriger automatiquement les utilisateurs du moteur de recherche
vers la porte d'entrée officielle des archives du quotidien en
ligne et ce quel que soit la requête initiale. Un exercice qui se
révèle délicat dans certains cas pour limiter les
détournements de trafic.
En France, Le Monde Interactif, filiale Internet
du Monde, a également été pris au piège de
l'indexation Google. L'année dernière, alors que le quotidien
en ligne passait au premium (un service qui comprenait un volet d'exploitation
des archives en payant), le JDN a pu constater à de nombreuses
reprises la possibilité de contourner le dispositif officiel pour
accéder directement aux articles archivés et théoriquement
payants. Depuis, la plupart des brèches semblent avoir été
colmatées : l'internaute se retrouve devant la page de présentation
d'un article archivé (titre et accroche) mais doit passer par la
case "caisse crédit d'archives" pour obtenir l'intégralité
du document. Malgré les progrès constatés dans ce
domaine, la filiale Internet du groupe de presse se refuse à tout
commentaire sur ce sujet. Google France n'a pas non plus répondu
à nos sollicitations. Une attitude étonnante de la part
des deux acteurs, compte tenu du partenariat qu'ils ont établi
à travers le service Google News, dont la version française
a été lancée en mai.
D'autres médias en ligne qui commercialisent
des archives en lignes en accès payant comme Libération.fr
ou LeFigaro.fr, et des acteurs moins connus comme l'association Transnationale.org
(qui propose des fiches entreprises et groupes en accès payant)
sont quant à eux parvenus à se faufiler entre les mailles
du filet Google.
[Philippe Guerrier, JDNet]