Google
vient de s'enrichir de nouvelles potentialités
étonnantes. Le moteur de recherche, qui proposait
déjà des recherches sur les documents
en .Pdf, et non plus uniquement au format hypertexte,
offre depuis le début du mois la possibilité
de rechercher sur le Web des mots-clés au sein
même de documents sous quatre nouveau formats
: Word (.doc), Excel (.xls), texte (.rtf) ou PowerPoint
(.ppt). En entrant un nom de domaine, gouv.fr pour les
sites gouvernementaux par exemple, l'utilisateur peut
ainsi fouiller entièrement, les documents sous
ces formats contenus dans le site et indexés
par le moteur de recherche.
Si ce nouvel outil constitue
une petite révolution, il pourrait poser des
problèmes si certains gestionnaires de site ne
sont pas vigilants. Les formats en .doc ou .xls, qui
pouvaient dormir tranquillement sur les sites sans être
repérés par l'internaute, ne sont plus
à l'abri des regards dans un moteur de recherche.
A l'heure où le gouvernement français
a retiré de ses sites des documents concernant
la sécurité nucléaire, les nouvelles
potentialités de Google risquent ainsi de poser
quelques problèmes si le nettoyage n'a pas été
bien effectué.
Quant aux webmasters ils
devront également veiller à ne pas déposer
de documents sensibles sous ces formats sur leur site.
En utilisant la nouvelle fonctionnalité de Google,
avec des mots-clés bien précis, Michel
Dumais, un journaliste
Canadien, affirme ainsi avoir déjà
localisé sur des sites gouvernementaux canadiens,
"des documents non-publics en .doc qui n'auraient
pas dû se trouver en ligne".
Google ne compte par ailleurs
pas s'arrêter là en matière d'innovation
cette année. Les ingénieurs du moteur
de recherche testent actuellement la possibilité
de prévisualiser les pages trouvées à
l'issue d'une recherche. Actuellement le moteur de recherche
indexerait 1,6 milliard de pages et enregistrerait plus
de 100 millions de requêtes par jour.
|