L'outil d'IA générative Runway a été utilisé pour cette expérimentation. Une première vidéo a été obtenue en une heure de travail environ. Voici comment.

Le JDN a créé son influenceur vidéo en utilisant exclusivement l'IA générative. Pour cette expérience, c'est l'outil de création automatique de vidéo de Runway qui a été utilisé. Une technologie de référence sur le marché (lire l'article Assistants intelligents de création vidéo : Runway tire son épingle du jeu). Voici le résultat :

"L'influenceur virtuel du JDN"

Comment a-t-on procédé ? Pour commencer, l'arrière-plan a été sélectionné. L'objectif était d'obtenir une animation de la page d'accueil du JDN. Nous avons soumis des captures d'écran correspondant au début et à la fin de l'animation. Runway s'est ensuite chargé de créer la transition entre les deux images.

Le résultat est de bonne facture, mais pas pour autant entièrement parfait. On note par exemple des inexatitudes dans les textes des captures d'écran. A y regardé de près, on constate notamment que Runway confond certaines lettres (notamment les à avec les o).

Création de l'animation vidéo en arrière plan. © JDN / Capture

Ensuite, nous avons conçu un prompt pour générer l'influenceur virtuel au premier plan. L'objectif était d'obtenir un homme en costume et cravate présentant la page d'accueil du JDN en toile de fonds. Nous avons suivi les conseils de Runway pour structurer ce prompt. Il devait être découpé ainsi :

[camera movement]: [establishing scene]. [additional details].

Il a fallu plusieurs essais avant d'obtenir le prompt permettant d'obtenir le résultat escompté. Sachant que l'outil se limite au support de l'anglais. Dans un premier temps, la vidéo générée était loin d'être probante. Des visages et titres parasites étaient ajoutés à l'animation. Runway faisait aussi apparaître plusieurs personnages au lieu d'un (voir vidéo ci-dessous).

"Influenceur vidéo du JDN : premier essai"

Au fil des essais, nous sommes parvenus à aboutir à l'objectif. Voici le prompt final : "Low angle static shot: A camera is angled up at a unic man wearing in jacket with tie. The man walks in front of a computer screen with the screenshot in the background and read and present the screenshot."

Là encore, le personnage obtenu n'est pas entièrement parfait. Il porte des micros-cravates ainsi qu'un troisième micro facial... Ce qui n'avait pas été précisé dans le prompt.

Interface de génération vidéo avec le prompt final utilisé. © JDN / Capture

Ce résultat obtenu au bout d'une heure de travail (en comptant le temps de prise en main de l'outil) laisse entrevoir le potentiel de la génération de vidéo. Reste que l'exercice n'est pas allé jusqu'à la synchronisation labiale qui aurait permis de faire parler notre influenceur. Cette technique nécessite pour l'heure de partir d'un visage en gros plan qui n'aurait pas permis de mettre en œuvre la mise en scène imaginée.