Comment optimiser les vidéos pour les IA génératives ?
Sur les SERP de la recherche "classique" de Google, les vidéos remportent un franc succès. YouTube est même devenu le deuxième site le plus populaire au monde. Les formats, souvent faciles à consommer, s’adaptent bien aux usages du mobile. Par exemple, en février 2025, les applications vidéo représentaient ainsi environ 76% du volume de données mobiles mondiales chaque mois.
Les vidéos représentent aussi une certaine partie des contenus affichés par les IA génératives. Mais cela reste difficile à quantifier. A cause, en partie, de la nature fondamentalement textuelle de ces plateformes et de la complexité de la mesure. On sait cependant que, selon une récente recherche de BrightEdge, YouTube est cité 200 fois plus que toute autre plateforme vidéo dans les résultats de recherche basés sur l'IA de ChatGPT, Perplexity et les produits d'IA de Google. On sait aussi que l’affichage de ces vidéos pourrait augmenter, à mesure que se développe le trafic sur les IA génératives ChatGPT, AI Mode, AI Overviews, Perplexity et peut-être Claude.
Les IA génératives intègrent généralement les vidéos
Pour bénéficier de cette apparition des vidéos dans ces IA et mieux comprendre comment s’adapter, il convient de s’intéresser d’abord aux spécificités du référencement de ces vidéos dans ces moteurs de réponse IA.
Pour AI Overviews et AI Mode, les extraits générés intègrent désormais des extraits vidéo, des vignettes et des éléments interactifs. Pour certaines requêtes sur les "Tutoriel GA4", Google peut afficher une vidéo YouTube directement dans l'aperçu. Les AI Overviews s’appuient sur la technique "Query Fan-out" pour extraire des extraits vidéo pertinents pour des requêtes complexes. Indiquons que cette technique amène à diviser une requête en plusieurs sous-requêtes, à compiler et à synthétiser la réponse.
Concernant ChatGPT, son application de bureau permet depuis quelques mois de lire des vidéos YouTube directement dans la fenêtre de chat. Les utilisateurs de la version Plus et Pro peuvent aussi bénéficier des vidéos intégrées. ChatGPT utilise le Reciprocal Rank Fusion, une méthode d’agrégation de classement. Pour chaque document ou passage, il additionne une valeur basée sur ses positions dans différents classements. Un document bien classé dans plusieurs systèmes obtient un meilleur score que celui classé très haut dans un seul système.
Perplexity quant à lui peut intégrer des vidéos dans son interface. Le sidecar, un service parallèle au LLM, lui permet d’interroger des APIs vidéo. Il récupère titres, descriptions, chapitres, transcriptions, chapitres pertinents. Il transforme la vidéo en objets exploitables par l’IA.
Claude d’Anthropic de son côté ne diffuse pas directement les vidéos dans ses réponses. Il génère plutôt des liens vers les vidéos ou des résumés. Claude peut cependant lire, comprendre et travailler sur du code HTML ou React. Il utilise pour cela une fonction spéciale appelée Artifacts. Elle sert à afficher et manipuler du code ou des documents dans un espace dédié à côté de la discussion.
Le SEO sert toujours
Une fois ce panorama établi, on peut se poser la question : de façon générale, comment être affiché dans ces IA génératives ? On retrouve en fait souvent des techniques similaires, d’après Bruno Santos, consultant SEO freelance. Pour lui, la clef à comprendre est que les IA exploitent prioritairement le texte déjà disponible. Elles prennent souvent le titre, la description, les chapitres, les sous-titres et légendes, la transcription, les commentaires, le contexte de la page qui héberge la vidéo, les données structurées (schema.org / VideoObject) et les signaux d’engagement (partages, embeds, citations).
Ainsi, pour Bruno Santos, optimiser une vidéo pour le GEO revient à transformer une vidéo en objet textuel parfaitement lisible par une IA. Pour y arriver, selon lui, la transcription constitue le levier numéro un. Elle doit être complète. Objectifs : permettre à l’IA de comprendre exactement le contenu, donner un contexte sémantique riche, multiplier les chances que la vidéo soit citée comme source et permettre aux IA d’extraire des réponses précises.
Egalement, selon lui, le titre et la description, comme un article SEO, doivent être soignés. "Le titre YouTube ne doit plus être marketing, mais informatif et descriptif. Un mauvais titre est : "La vérité sur le SEO que personne ne vous dit." On préférera plutôt "Comment fonctionne l’indexation Google en 2026 (SEO, IA, AI Overviews)." La description suit la même logique. Elle doit résumer clairement le contenu, comme une introduction d’article.»
Adrien Lahalle, consultant SEO et Youtubeur, privilégie aussi les titres SEO à ses vidéos, dans certains cas, et les descriptions détaillées. "Concrètement, lors du lancement d’une vidéo, je teste différents titres que j'ai sélectionnés avec ChatGPT. Le but, maximiser la visibilité dans les premières semaines. Ensuite, si le contenu est de type evergreen, par exemple : "Comment nettoyer une pierre à pizza", je remplace le titre initial "clickbait" par un titre purement SEO. Et je retravaille également la description avec des mots-clés précis. Cette combinaison permet à la vidéo de continuer à bien se positionner dans le temps. Cela est d’ailleurs une spécificité très puissante de YouTube, comparé à Instagram ou TikTok. Résultat, j'ai constaté il y a un an de cela que mes vidéos étaient utilisées comme source dans Gemini."
Au niveau des chapitres, le mot d’ordre de Bruno Santos est la structuration. Le but est de segmenter l’information, faciliter l’extraction de passages précis et augmenter les chances d’être cité pour une question spécifique. Une façon notamment de s’adapter au query fan-out de Google.
Il conseille enfin d’intégrer la vidéo dans un contexte éditorial. Certainement pour ajouter de la sémantique à tout cela. Les vidéos peuvent être incorporées avec un contenu explicite, une transcription, mais aussi des données structurées VideoObject. Des sous-titres natifs peuvent également amener les faveurs de l’IA.
Pour mettre en musique tout cela, les points d’accès textuels peuvent être multipliés. On pense aux articles de blog, newsletters, posts LinkedIn ou encore pages ressources. "Par exemple, les vidéos de French Tax Online sont systématiquement intégrées dans des articles de blog très détaillés", lance Bruno Santos. "Certaines vidéos sont clairement pensées pour cibler des requêtes SEO précises, d’autres sont plus naturelles, orientées audience YouTube. Mais dans les deux cas, elles sont entourées d’un maximum de contenu textuel cohérent."
Pour lui, du point de vue d’une IA comme ChatGPT, Perplexity, Gemini ou les AI Overviews, "ce n’est pas une vidéo YouTube qui est vue. C’est un article très riche, très structuré, très sémantique… qui contient une vidéo parfaitement alignée avec le texte. Et c’est là que tout change. L’IA ne cherche pas des vidéos. Elle cherche des sources textuelles fiables."
Toutes ces actions ont permis à Bruno Santos d’augmenter fortement le nombre de ses nouveaux utilisateurs sur quelques mois avec l’IA. Le graphique incorpore les optimisations textuelles et pour la vidéo à proprement parlé.