Google lance un service de reconnaissance vocale pour vidéos

Google vient de lancer un service de reconnaissance vocale, permettant de transcrire les voix des vidéos diffusées sur YouTube en textes. Le moteur de recherche teste actuellement cet outil sur les discours filmés des deux principaux candidats à l'élection présidentielle américaine, Barack Obama et John McCain.

Baptisé "Video Search gadget", il se présente pour l'instant sous la forme d'un widget à intégrer dans le service de pages d'accueil personnalisables iGoogle. Il permet d'accéder directement dans les vidéos aux passages au cours desquels un des candidats prononce le mot-clé recherché. Video Search gadget matérialise par une marque jaune sur la jauge de défilement de la vidéo toutes les occurrences du terme demandé. Un clic sur une des marques fait apparaître la section de texte contenant le mot recherché.

Google cherche ainsi à améliorer le référencement des contenus vidéo, dont le positionnement dans les moteurs de recherche dépend essentiellement de quelques tags définis par l'auteur du clip. En transcrivant en texte l'intégralités des discussions d'une vidéo, Google intégrerait un corpus de mots-clés beaucoup plus important. Outre le référencement, cette transcription permettrait d'améliorer le service de suggestions de vidéos connexes de YouTube.

Google n'est pas le seul à miser sur la technologie "Speech-to-Text" : au sein de son AdCenter Lab, Microsoft travaille actuellement sur une technologie de reconnaissance vocale permettant d'identifier automatiquement les concepts clés d'un contenu vidéo pour afficher des liens publicitaires plus pertinents.