INTERVIEW 
 
Craig Silverstein
Directeur de la technologie
Google
Craig Silverstein
"Nous travaillons sur un accès multicanal de Google"
Google multiplie les pistes R&D à travers sa division Google Labs. Les projets technologiques du numéro un des moteurs ne manquent pas. Quitte à dérouter les responsables des sites indexés.
(30/03/2004)
 
JDN. La presse économique ne cesse d'évoquer une prochaine introduction en Bourse. Peut-on en savoir plus sur vos intentions ?
  En savoir plus
Dossier Google
Craig Silverstein. C'est vrai qu'il y a beaucoup de spéculations. Mais Google n'a toujours pas effectué d'annonces importantes sur le sujet. Je ne peux pas apporter de commentaires supplémentaires.

De combien de développeurs Google dispose-t-il dans le monde ?
Nous avons plusieurs équipes réparties sur différents sites géographiques : la région de Bangalore en Inde, Zürich et New York. En général, nous ne communiquons pas sur l'effectif global de Google, encore moins sur le nombre d'ingénieurs et de développeurs, qui est une information stratégique.

Pourriez-vous nous donner quelques pistes de développement sur lesquels Google travaille ?

Je ne peux pas révéler la teneur des projets spécifiques que Google pourrait lancer à court terme. En revanche, je peux aborder les derniers domaines d'exploration de Google Labs, notre division qui nous sert de laboratoire R&D où nous testons nos idées de programmation en vue d'un lancement grand public. Nous avons développé un outil permettant d'utiliser la technologie Google sans ouvrir le navigateur Web de son PC (Google Deskbar). Nous regardons également le potentiel liant mobilité et shopping avec notre produit Froogle Wireless qui permet à un utilisateur de déterminer quel magasin vend à proximité un produit donné.

En l'état actuel, l'index de Google couvre six milliards de pages Web. Cela représente quelle proportion du World Wide Web ?
Honnêtement, j'ignore la taille exacte du World Wide Web dans son intégralité. Je ne pense que quelqu'un puisse réellement le savoir. Il y a deux ou trois ans, un groupe de recherche - rattaché au groupe Nec je crois - a essayé de mesurer la taille du Web. A l'époque, il estimait le nombre de pages Web à quatre ou cinq milliards. Mais ces repères sont obsolètes compte tenu de la croissance du Web.

Google veut-il couvrir le World Wide Web dans son intégralité ?
Nos efforts portent naturellement sur les moyens de fournir un maximum d'informations à nos utilisateurs. Logiquement, nous approfondissons nos outils pour récupérer de plus en plus d'informations sur le Web afin de proposer un éventail plus large. Mais cela ne s'arrête pas là : nous comptons également intégrer dans notre index des informations en provenance d'autres supports comme les documents imprimés.

Dans cette lignée, Yahoo veut indexer des bases officielles "cachées" du Web comme la documentation de la bibliothèque du Congrès américain. Google suit-il cette voie ?
Nous venons de démarrer un programme pour faciliter la recherche de livres à travers notre index. Nous travaillons en collaboration avec les éditeurs dans ce sens. Ils nous fournissent la version électronique de leurs contenus. A charge pour nous de rendre cette documentation disponible sur notre moteur. Attention, il ne s'agit pas de mettre en accès gratuit l'intégralité des ouvrages mais de favoriser l'achat à travers des liens hypertexte. Nous avons un autre programme dans le même sens autour des catalogues. Nous les scannons de manière à les rendre disponibles pour des recherches sur Internet.

Quid de l'indexation des fichiers musicaux ou vidéo ?
C'est techniquement possible mais les entreprises médias ne souhaitent pas que leurs catalogues soient directement accessibles via un moteur de recherche.

Google et Google News, deux technologies différentes"
Quelles réponses donnez-vous aux éditeurs médias français qui refusent qu'une partie de leur contenu soit accessible via le moteur de recherche ou repris sur Google News ?
Je peux comprendre la réaction des éditeurs qui développent des services de contenus payants à l'idée de voir une partie de leur contenu en accès libre. Nous sommes respectueux des choix qu'ils ont fait. En qualité d'agrégateur médias, nous croyons intéressant de proposer un accès gratuit à l'actualité du monde entier avec un modèle économique qui repose sur la publicité et les mots-clés. Si un éditeur souhaite que son contenu soit retiré de l'index de Google, nous nous plions à sa demande. Pour Google News, je ne sais pas. L'index de Google et Google News sont deux technologies différentes. Un point différenciant porte sur le rafraîchissement des pages, qui est réalisé plusieurs fois par jour pour Google News.

Une autre polémique est liée à des marques commerciales qui s'estiment lésées par le système de mots-clés sur votre service de liens sponsorisés AdWords. Quelle position avez-vous adopté ?
Lorsqu'un détenteur légitime d'une marque exprime son mécontement vis-à-vis du système AdWords, il prend contact avec nous et nous nous retournons vers notre client annonceur pour trouver une solution. Nous comptons beaucoup sur le partenariat avec nos annonceurs publicitaires pour éviter ce genre de situation.

Fin 2003, à la suite de travaux sur les algorithmes du moteur, certains cybermarchands ont manifesté leur mécontentement car ils ont perdu en visibilité sur les pages de résultats. Comment gérez-vous ce type de plaintes ?
Nous travaillons constamment sur le moteur de recherche, ce qui entraîne des modifications parfois mineures, parfois plus significatives. Mais nous analysons toujours les retombées sur les pages de résultats. Logiquement, les sites marchands ne peuvent pas être assurés de garder le même rang sur une page de résultats. Nous devons toujours prendre le temps d'expliquer que la position d'un site sur nos pages de résultats ne dépend pas de nous car il n'y aucune intervention humaine derrière notre moteur en dehors de la définition des algorithmes. C'est aux responsables Internet des entreprises de veiller au bon positionnement du site.

Google donne parfois accès à des données sensibles mal protégées"
Pouvez-vous maîtriser l'ensemble des répercussions lié aux développements technologiques de la recherche sur Internet ?
Les résultats sont parfois suprenants, mais véridiques. Par exemple, une personne A effectue une recherche en ligne à partir du nom de la personne B qu'elle doit prochainement rencontrer. Elle se rend compte que son interlocuteur est considéré comme un criminel par la police. Une découverte en ligne qui a abouti à son arrestation. Autres conséquences inattendues : l'accessibilité aisée à des documents sensibles ou confidentiels d'entreprises qui n'ont pas été correctement sécurisés.

Quels conseils donnez-vous aux entreprises pour se prémunir des risques de trop grande visibilité à des données sensibles en ligne ?
Des documents sensibles peuvent être repérés par le crawling de Google à partir du moment où un responsable d'un site Internet a configuré un site Web qui facilite cette tâche. Il s'agit d'adopter une attitude prudente lors de l'indexation d'un site.

Que vous inspire le peer-to-peer ?
Cette technologie ne me semble pas encore totalement mature pour en faire un produit fini. C'est une piste intéressante pour la recherche et le développement, parmi d'autres centres d'intérêts. Nous gardons un oeil dessus.

Selon vous, quel est le moteur de recherche qui serait le plus sérieux challenger pour Google ?
Effectuer une veille concurrentielle sur les activités des autres sociétés n'est pas notre principal défi. Nous cherchons plutôt à déterminer quelles sont les améliorations que nous pouvons apporter dans les réponses que le moteur fournit à nos utilisateurs.

Avec des acteurs comme MSN Search ou Yahoo, la concurrence est rude sur votre marché...
Le spectre des problématiques liées à la recherche sur Internet est étendu. Nous sommes ravis de voir que d'autres entreprises se concentrent sur l'expérience utilisateur pour améliorer les fonctionnalités.

  En savoir plus
Dossier Google
Comment avez-vous rencontré Sergei Brin et Larry Page, les co-fondateurs de Google ?
Nous étions tous les trois des étudiants à l'université de Stanford. Je les connaissais avant le démarrage du projet Google. Lorsque j'ai vu Sergei Brin et Larry Page passer à l'action, j'étais tellement fasciné par ce projet que j'ai voulu m'y joindre.
 
 
Propos recueillis par Philippe GUERRIER, JDN

PARCOURS
 
 
Craig Silverstein est détenteur d'un Bachelor of Science de Harvard College (Massachusetts) et d'une bourse technique de Microsoft Technical. A deux reprises, il a obtenu le Derek Bok Award pour excellence d'enseignement. Il est toujours en train de terminer un Ph.D. d'informatique à l'université de Stanford, orienté vers la récupération d'information et l'analyse de données de type "data mining".

Craig Silverstein a créé une partie des modules informatiques qui ont soutenu le déploiement initial et la croissance de Google. Il a également apporté à Google les compétences en matière d'algorithmes de compression accumulées pour son projet de recherche à Stanford.

Parmi ses autres recherches universitaires réalisées au Palo Alto Research Center de Xerox, on peut citer les versions optimisées des structures de données élémentaires : tables de hachage, regroupement des grands ensembles de données par Scatter/Gather et indexation sémantique latente.

   
 
 
  Nouvelles offres d'emploi   sur Emploi Center
Chaine Parlementaire Public Sénat | Michael Page Interim | 1000MERCIS | Mediabrands | Michael Page International