Recherche temps réel : Google à la poursuite de Bing

Le moteur plancherait sur un module d'indexation qui prend en compte les contenus Web au fur et à mesure de leur publication. Une démarche déjà mise en œuvre par Microsoft.

Si le lancement de la prochaine version du moteur de Google, Google Caffeine, initialement prévu à noël dernier, a finalement été repoussé à l'été prochain, le groupe de Mountain View n'en poursuit pas moins ses travaux de R&D autour de son noyau d'indexation.

L'un des grands défis de Google : rattraper son retard en matière de recherche temps réel face à Microsoft. Depuis l'inauguration de la version finale de Bing aux Etats-Unis en juin 2009, l'éditeur de logiciels fait en effet du temps réel son cheval de bataille.

C'est dans cette optique que Google s'est lancé dans le développement d'un module d'indexation au fil de l'eau basé sur son protocole PubSubHubbub. L'information a été révélée par notre confrère ReadWriteWeb.

Mais ce n'est pas la première initiative du genre pour le moteur. Cette nouvelle politique remonte en fait à novembre 2009, avec le coup d'envoi d'un programme de partenariats visant à rapprocher Google de réseaux sociaux et services de microblogging. Objectif du groupe : bénéficier de flux en mode push en provenance de ces sites permettant de publier des résultats de recherche mis à jour automatiquement au fur et à mesure de la publications publications réalisées.

Impliquer d'autres moteurs de recherche pour standardiser le mode push

Le projet de module d'indexation temps réel se place dans la même logique. L'enjeu est bien de rattraper Bing dont la démarche de partenariats s'étant déjà jusqu'aux sites d'e-commerce - notamment en vue de construire un gigantesque comparateur de produits.

Mais avec sa nouvelle brique, Google cherche aussi à standardiser ce mécanisme d'indexation en mode push. Mis au point par l'un de ses développeurs (Bret Slatkin), le protocole sur lequel il s'appuie (PubSubHubbub) repose sur les formats de syndication Atom et RSS.

Concrètement, PubSubHubbub permet de mettre en place sur un site Web un service équivalent à un flux RSS. A chaque contenu publié, le service permet de notifier automatiquement à ses abonnées l'existence d'une mise à jour. Le protocole est déjà utilisé pour Google Reader et Google Alertes, qui permettent tous deux à leurs utilisateurs d'être alertés d'une mise à jour sur un site – par le biais d'une interface Web pour le premier, et par e-mail pour le second.

Avec le nouveau module d'indexation, ce ne serait plus des utilisateurs, par le biais de solutions de syndication de flux, qui seraient alertés, mais bien les moteurs de recherche.

Car Google souhaiterait aller encore plus loin en proposant à d'autres moteurs de travailler sur le projet avec lui en vue d'aboutir à une technologie standardisée d'indexation temps réel. Un programme de test serait d'ailleurs en cours d'élaboration pour proposer un premier jet à la communauté des référenceurs.