|
|
|
|
Craig Silverstein
Directeur
de la technologie
Google |
|
Craig
Silverstein
"Nous travaillons sur un accès multicanal de Google"
Google multiplie les pistes R&D à travers sa division Google Labs. Les projets technologiques du numéro un des moteurs ne manquent pas. Quitte à dérouter les responsables des sites indexés.
(30/03/2004) |
|
|
|
JDN.
La presse économique ne cesse d'évoquer
une prochaine introduction en Bourse. Peut-on en savoir
plus sur vos intentions ?
Craig Silverstein. C'est vrai qu'il y a beaucoup
de spéculations. Mais Google n'a toujours pas effectué
d'annonces importantes sur le sujet. Je ne peux pas apporter
de commentaires supplémentaires.
De combien de développeurs
Google dispose-t-il dans le monde ?
Nous avons plusieurs équipes réparties sur
différents sites géographiques : la région
de Bangalore en Inde, Zürich et New York. En général,
nous ne communiquons pas sur l'effectif global de Google,
encore moins sur le nombre d'ingénieurs et de développeurs, qui est une information stratégique.
Pourriez-vous
nous donner quelques pistes de développement sur lesquels Google
travaille ?
Je ne peux pas révéler la teneur des projets
spécifiques que Google pourrait lancer à
court terme. En revanche, je peux aborder les derniers
domaines d'exploration de Google Labs, notre division
qui nous sert de laboratoire R&D où nous testons
nos idées de programmation en vue d'un lancement
grand public. Nous avons développé un outil
permettant d'utiliser la technologie Google sans ouvrir
le navigateur Web de son PC (Google
Deskbar). Nous regardons également le potentiel
liant mobilité et shopping avec notre produit Froogle
Wireless qui permet à un utilisateur de déterminer
quel magasin vend à proximité un produit
donné.
En l'état actuel, l'index
de Google couvre six milliards de pages Web. Cela représente
quelle proportion du World Wide Web ?
Honnêtement, j'ignore la taille exacte du World
Wide Web dans son intégralité. Je ne pense
que quelqu'un puisse réellement le savoir. Il y
a deux ou trois ans, un groupe de recherche - rattaché
au groupe Nec je crois - a essayé de mesurer la
taille du Web. A l'époque, il estimait
le nombre de pages Web à quatre ou cinq milliards.
Mais ces repères sont obsolètes compte tenu
de la croissance du Web.
Google veut-il couvrir le World
Wide Web dans son intégralité ?
Nos efforts portent naturellement sur les moyens de fournir
un maximum d'informations à nos utilisateurs. Logiquement,
nous approfondissons nos outils pour récupérer
de plus en plus d'informations sur le Web afin de proposer
un éventail plus large. Mais cela ne s'arrête
pas là : nous comptons également intégrer
dans notre index des informations en provenance d'autres
supports comme les documents imprimés.
Dans cette lignée, Yahoo
veut indexer des bases officielles "cachées"
du Web comme la documentation de la bibliothèque
du Congrès américain. Google suit-il cette
voie ?
Nous venons de démarrer un programme pour faciliter
la recherche de livres à travers notre index. Nous
travaillons en collaboration avec les éditeurs
dans ce sens. Ils nous fournissent la version électronique
de leurs contenus. A charge pour nous de rendre cette
documentation disponible sur notre moteur. Attention,
il ne s'agit pas de mettre en accès gratuit l'intégralité
des ouvrages mais de favoriser l'achat à travers
des liens hypertexte. Nous avons un autre programme dans
le même sens autour des catalogues. Nous les scannons
de manière à les rendre disponibles pour
des recherches sur Internet.
Quid de l'indexation des fichiers
musicaux ou vidéo ?
C'est techniquement possible mais les entreprises médias
ne souhaitent pas que leurs catalogues soient directement
accessibles via un moteur de recherche.
|
|
Google
et Google News, deux technologies différentes" |
|
Quelles réponses donnez-vous
aux éditeurs médias français qui
refusent qu'une partie de leur contenu soit accessible
via le moteur de recherche ou repris sur Google News ?
Je peux comprendre la réaction des éditeurs
qui développent des services de contenus payants
à l'idée de voir une partie de leur contenu
en accès libre. Nous sommes respectueux des choix
qu'ils ont fait. En qualité d'agrégateur
médias, nous croyons intéressant de proposer
un accès gratuit à l'actualité du
monde entier avec un modèle économique qui
repose sur la publicité et les mots-clés.
Si un éditeur souhaite que son contenu soit retiré
de l'index de Google, nous nous plions à sa demande.
Pour Google News, je ne sais pas. L'index de Google et
Google News sont deux technologies différentes.
Un point différenciant porte sur le rafraîchissement
des pages, qui est réalisé plusieurs fois
par jour pour Google News.
Une autre polémique
est liée à des marques commerciales qui
s'estiment lésées par le système
de mots-clés sur votre service de liens sponsorisés
AdWords. Quelle position avez-vous adopté ?
Lorsqu'un détenteur légitime d'une marque
exprime son mécontement vis-à-vis du système
AdWords, il prend contact avec nous et nous nous retournons
vers notre client annonceur pour trouver une solution.
Nous comptons beaucoup sur le partenariat avec nos annonceurs
publicitaires pour éviter ce genre de situation.
Fin 2003, à la suite
de travaux sur les algorithmes du moteur, certains cybermarchands
ont manifesté leur mécontentement car ils
ont perdu en visibilité sur les pages de résultats.
Comment gérez-vous ce type de plaintes ?
Nous travaillons constamment sur le moteur de recherche,
ce qui entraîne des modifications parfois mineures,
parfois plus significatives. Mais nous analysons toujours
les retombées sur les pages de résultats.
Logiquement, les sites marchands ne peuvent pas être
assurés de garder le même rang sur une page
de résultats. Nous devons toujours prendre le temps
d'expliquer que la position d'un site sur nos pages de
résultats ne dépend pas de nous car il n'y
aucune intervention humaine derrière notre moteur en dehors de la définition des algorithmes.
C'est aux responsables Internet des entreprises de veiller
au bon positionnement du site.
|
|
Google donne parfois accès à des données sensibles mal protégées" |
|
Pouvez-vous maîtriser
l'ensemble des répercussions lié aux développements
technologiques de la recherche sur Internet ?
Les résultats sont parfois suprenants, mais véridiques. Par exemple,
une personne A effectue une recherche en ligne à
partir du nom de la personne B qu'elle doit prochainement
rencontrer. Elle se rend compte que son interlocuteur
est considéré comme un criminel par la police.
Une découverte en ligne qui a abouti à son
arrestation. Autres conséquences inattendues :
l'accessibilité aisée à des documents
sensibles ou confidentiels d'entreprises qui n'ont pas été correctement sécurisés.
Quels conseils donnez-vous
aux entreprises pour se prémunir des risques de
trop grande visibilité à des données
sensibles en ligne ?
Des documents sensibles peuvent être repérés
par le crawling de Google à partir du moment où
un responsable d'un site Internet a configuré un
site Web qui facilite cette tâche. Il s'agit d'adopter
une attitude prudente lors de l'indexation d'un site.
Que vous inspire le peer-to-peer ?
Cette technologie ne me semble pas encore totalement mature
pour en faire un produit fini. C'est une piste intéressante
pour la recherche et le développement, parmi d'autres
centres d'intérêts. Nous gardons un oeil
dessus.
Selon vous, quel est le moteur
de recherche qui serait le plus sérieux challenger
pour Google ?
Effectuer une veille concurrentielle sur les activités
des autres sociétés n'est pas notre principal
défi. Nous cherchons plutôt à déterminer
quelles sont les améliorations que nous pouvons
apporter dans les réponses que le moteur fournit
à nos utilisateurs.
Avec des acteurs comme MSN
Search ou Yahoo, la concurrence est rude sur votre marché...
Le spectre des problématiques liées à
la recherche sur Internet est étendu. Nous sommes
ravis de voir que d'autres entreprises se concentrent
sur l'expérience utilisateur pour améliorer
les fonctionnalités.
Comment avez-vous rencontré
Sergei Brin et Larry Page, les co-fondateurs de Google ?
Nous étions tous les trois des étudiants
à l'université de Stanford. Je les connaissais avant
le démarrage du projet Google. Lorsque j'ai vu
Sergei Brin et Larry Page passer à l'action, j'étais
tellement fasciné par ce projet que j'ai voulu
m'y joindre. |
|
|
Propos recueillis par Philippe GUERRIER, JDN |
|
PARCOURS
|
|
|
|
Craig Silverstein est détenteur d'un
Bachelor of Science de Harvard College (Massachusetts)
et d'une bourse technique de Microsoft Technical.
A deux reprises, il a obtenu le Derek Bok Award
pour excellence d'enseignement. Il est toujours en train de terminer un Ph.D.
d'informatique à l'université de Stanford, orienté
vers la récupération d'information et l'analyse
de données de type "data mining".
Craig Silverstein a créé une partie des modules
informatiques qui ont soutenu le déploiement initial
et la croissance de Google. Il a également
apporté à Google les compétences en matière d'algorithmes
de compression accumulées pour son projet de recherche
à Stanford.
Parmi ses autres recherches universitaires réalisées
au Palo Alto Research Center de Xerox, on peut citer
les versions optimisées des structures de données
élémentaires : tables de hachage, regroupement des
grands ensembles de données par Scatter/Gather et
indexation sémantique latente.
|
|
|
|
|
|
|