Jean-Louis Bénard (Brainsonic) "Le speech to text permet un référencement efficace des vidéos"

La question du référencement des contenus Web qui ne sont pas au format HTML pose des problèmes techniques conséquents. Mais des méthodes commencent à arriver à maturité et permettent des évolutions intéressantes.

Quelles sont les différentes méthodes permettant aujourd'hui de référencer de la vidéo correctement sur des moteurs de recherche Web ?

Le premier axe consiste à travailler les méta données associées à la vidéo. La saisie des informations telles que le titre de la vidéo et un résumé écrit de son contenu sont alors nécessaire. Cette saisie peut se faire manuellement, ou bien par le biais d'une transcription multilingue, voire d'une transcription automatique. Il s'agit là de ce que l'on appelle l'analyse speech to text. L'idée est de transcrire automatiquement les sons des vidéos au format texte pour permettre un meilleur référencement du contenu.

De fait, sur les interfaces de Web TV que nous mettons en place, nous créons une déclinaison HTML de chaque vidéo avec les meta données et les permaliens.

Par ailleurs, pour nos clients qui utilisent une plate-forme de Web TV, nous recommandons la multi publication sur des sites tels que Dailymotion et You Tube, mais aussi d'y adjoindre des problématiques de référencement payant en plus du référencement naturel.

"Nous recommandons aussi la multi publication"

Ce travail technique de référencement suffit-il ?

Non, un second axe de travail est absolument nécessaire. Il s'agit d'un travail éditorial, à destination de l'internaute qui va être amené à juger une vidéo et son contenu avant même de l'avoir visionnée. C'est la raison pour laquelle nous travaillons beaucoup sur le titre et le résumé de la vidéo visible par l'internaute. Il s'agit en fait de construire sur ces quelques lignes la promesse éditoriale qui va faire cliquer l'internaute sur la vidéo.

Ce travail éditorial est aussi très important en termes de référencement. Quand on applique la technique de SEO [ndlr. Search Engine Optimization] sans pour autant travailler l'éditorial, les moteurs ne sont pas dupes, et le référencement en pâtis.

La technique dite du Speech to text est-elle nouvelle ? Quelle est son histoire ?

Cette technique demande un processus particulier, qui n'est pas aujourd'hui totalement démocratisé. Mais son besoin est dors et déjà réel : le nombre de vidéos présentes sur la toile a déjà dépassé le nombre de requêtes sur les moteurs de recherche.

L'initiateur de cette technique est le moteur de recherche Google qui a commencé à la pratiquer pour les vidéos de son site de vidéos en ligne You Tube pendant la dernière campagne présidentielle aux Etats-Unis. Les autres acteurs ont suivi, Adobe l'a fait sur certains contenus et il est probable que Microsoft s'en préoccupe aussi. Bref, cette technique va arriver à maturité dans un ou deux ans je pense.

On se dirige même vers deux niveaux de technicité de cette technique : le speech to text classique tel que nous le connaissons aujourd'hui, et une version évoluée qui comprendra en plus des bandes sons des vidéos, les timecode de celles-ci. Ainsi, il sera possible de rendre compte au format texte du séquençage vidéo.