Comment utiliser la génération de vidéo cinématique dans NotebookLM

Avec Cinematic Video Overviews, NotebookLM se dote d'un générateur de vidéo puissant capable de résumer et d'illustrer des sujets complexes dans une vidéo de 5 minutes environ.

Après avoir dévoilé sa nouvelle famille Gemini 3.1 de LLM multimodaux, Google enrichit encore l'expérience NotebookLM. L'ovni de la suite Workspace accueille depuis le 5 mars un nouveau mode, Cinematic Video Overviews, permettant de créer de manière entièrement autonome des vidéos immersives à partir des documents envoyés à l'IA. Scénarisation, illustration, animation, montage : la vidéo est produite de bout en bout avec un niveau de finition qui se rapproche de ce qu'aurait livré une équipe humaine.

Le nouveau mode Cinematic Video Overviews repose sur un pipeline sophistiqué orchestrant trois modèles distincts, chacun expert dans son domaine. Gemini 3 agit comme un véritable directeur créatif : il analyse l'ensemble des sources uploadées pour en extraire la trame narrative et identifier les concepts clés. Mais son rôle va bien au-delà de la simple compréhension. Selon Google, Gemini 3 prend "des centaines de décisions structurelles et stylistiques" pour déterminer le meilleur format, le style visuel adapté au sujet, le rythme des séquences et la progression dramatique. Le modèle va même jusqu'à raffiner son propre travail de manière itérative pour garantir la cohérence de la vidéo finale.

Intervient ensuite Nano Banana, le générateur d'images maison de Google. Le modèle produit les visuels détaillés et riches qui serviront de matière première : illustrations, graphiques, scènes composées. Enfin, Veo 3, le modèle de génération vidéo de Google, transforme l’ensemble des éléments statiques en séquences animées fluides. Il gère les transitions, les mouvements de caméra ainsi que les effets de profondeur pour produire des vidéos “immersives” d'environ cinq minutes.

Le test du JDN

Pour l’heure Cinematic Video Overviews est disponible uniquement pour les utilisateurs payants de Google AI Ultra (274 euros par mois) et Google AI Pro (21,99 euros par mois). Petit bémol, seuls les comptes basés dans un pays anglophone peuvent accéder à la fonctionnalité (avant une généralisation probable dans les prochains mois). Nous avons pu tester en avant-première l’outil depuis un compte Google hébergé aux Etats-Unis. Les premiers résultats sont très surprenants.

Pour tester l’outil, nous allons lui donner trois cas d’usage radicalement différents : un papier de recherche, pour mesurer sa capacité à être didactique, une recherche approfondie (deep research) sur un fait d’actualité récent pour analyser le comportement de l’IA avec des nouvelles fraîches et un rapport financier pour mesurer comment l’IA est capable d’illustrer des données très abstraites.

Comment utiliser Cinematic Video Overviews ? Il suffit d’uploader ses documents dans un NotebookLM et de cliquer ensuite sur “Video Overview”, de sélectionner Cinematic et enfin de donner (ou non) quelques instructions sur la stratégie globale de création vidéo.

1. L’article de recherche

Pour le premier test, nous donnons à l’IA un article de recherche récent sur l’utilisation des LLM pour désanonymiser des pseudonymes en ligne. Des chercheurs de l’ETH Zurich et d’Anthropic démontrent que les LLM permettent désormais de lever l'anonymat des comptes pseudonymes en ligne de manière automatisée et à grande échelle. Nous demandons à l’IA, dans Instructions, de se concentrer sur l’explication de la méthode employée par les chercheurs et leurs résultats en illustrant concrètement avec de beaux visuels.

Prompt : Focus on explaining the researchers' methodology in very simple terms, and on the concrete results and implications. Use visually appealing and consistent materials to avoid boring the viewer.

La vidéo générée colle parfaitement à la consigne fournie en entrée. NotebookLM produit des illustrations simples, lisibles et bien contextualisées, qui rendent l'ensemble très cohérent et quasi production ready. On relève toutefois quelques erreurs mineures dans le texte incrusté à l'image. Un défaut récurrent de la génération par IA, mais qui reste ici suffisamment discret pour ne pas nuire à la compréhension globale.

2. Un fait d’actualité illustré

Pour ce second test, nous lançons dans Notebook LM une recherche approfondie sur la fermeture du détroit d'Ormuz et ses implications sur l'économie mondiale. Nous demandons ensuite à l'IA de produire une vidéo explicative sur le rôle stratégique de ce passage maritime dans les flux énergétiques mondiaux et les répercussions directes d'un blocage sur les économies occidentales. L'objectif : obtenir une vidéo pédagogique, visuellement riche, ancrée dans l'actualité géopolitique récente et capable de vulgariser un sujet complexe en quelques minutes.

Prompt : First, show on a world map the flows that normally pass through it (oil, gas, shipping routes, volumes, countries involved), then explain what happens when it is blocked (flows interrupted, countries impacted, consequences for prices and supply). The map should remain visible as a guide, numerous animations should be used to make the flows easier to understand, and all data points must be sourced.

Plus impressionnant encore, cette deuxième vidéo illustre parfaitement les capacités du mode cinématique. Photographies réelles du détroit d'Ormuz, séquences générées par IA, visualisations cartographiques produites à la volée, graphiques venant appuyer chaque donnée clé : le tout compose une vidéo véritablement agréable à regarder, proche d'un documentaire web natif comme on en trouve beaucoup sur YouTube. Seule la voix, légèrement monotone, rappelle que l'on regarde un contenu généré par IA.

3. Un rapport financier

Enfin pour le troisième test, nous demandons à l’IA d’analyser les résultats financiers de Tesla. Nous donnons à l'outil le Q4 2025 de l'entreprise. Le but va être d’illustrer avec la vidéo comment Tesla parvient à des records de trésorerie avec une baisse notable des ventes de ses véhicules.

Prompt : Focus on how Tesla manages to have a cash surplus despite declining electric vehicle sales. Don't get bogged down in the numbers; use only key figures to explain, and use plenty of illustrations.

Là encore, NotebookLM produit une vidéo quasi production ready, avec des visuels cohérents et une reproduction fidèle des véhicules Tesla. L'explication des différentes sources de revenus du constructeur se révèle très didactique. Le seul vrai reproche tient à un recours parfois abusif à l'infographie pour illustrer des concepts qui n'en ont pas besoin. Ces visuels manquent aussi ponctuellement de précision : nombreuses légendes redondantes, flèches mal alignées. Le résultat global reste néanmoins convaincant, et ces erreurs mineures n'entachent pas la cohérence d'ensemble.

Un outil précieux

NotebookLM propose désormais un éventail impressionnant de formats de sortie : quiz interactifs, podcasts audio générés automatiquement, cartes mentales, rapports textuels structurés, flashcards, infographies, présentations PowerPoint et tableaux de données. Avec Cinematic Video Overviews, Google franchit un cap supplémentaire : l'IA ne se contente plus de comprendre vos documents, elle les met en scène. Attention toutefois, le processus est long (1 heure en moyenne selon nos tests). Une polyvalence qui fait de NotebookLM un outil particulièrement précieux pour les professionnels qui souhaitent prototyper rapidement des présentations, analyser des sujets complexes ou illustrer des projets sans mobiliser une équipe de production complète. Le rythme d'évolution de NotebookLM est peut-être le meilleur indicateur de l'accélération actuelle de l'IA générative. Il y a un an, l'outil savait résumer un PDF. Aujourd'hui, il en tire un documentaire de cinq minutes. Difficile d'imaginer où il en sera dans un an.