Résumé de document complexes, génération d'un podcast complet... On revient sur les principales fonctionnalités de cet outil singulier, lancé il y a un an.

Oublié pendant plus d'un an, NotebookLM commence tout juste à sortir du bois. Avec l'arrivée de nouvelles fonctionnalités différenciatrices, l'ovni technologique de Google commence à prendre. La prise en charge des PDF complexes (avec de nombreuses images, des graphiques) et l'arrivée de la génération automatique de podcast en font un outil prometteur. Explications.

Un objectif simple : apporter des données qualifiées à l'IA

Initialement présenté lors de la Google I/O 2023 sous le nom de "Project Tailwind", l'outil devrait répondre au défi de la surcharge d'informations en aidant les utilisateurs à synthétiser des faits et des idées provenant de multiples sources grâce à l'IA générative. Développé par une équipe restreinte au sein de Google Labs, NotebookLM a connu une expansion rapide, passant d'un déploiement initial aux Etats-Unis à une disponibilité dans plus de 200 pays cet été.

Disponible gratuitement en France depuis juin 2024, l'outil permet d'utiliser l'IA générative, (en l'occurrence Gemini 1.5 Pro) pour synthétiser de manière assez intelligente une vaste quantité de documents. Outre le résumé, NotebookLM permet de discuter avec l'IA en utilisant les données en source unique présentes dans les documents. La force de NotebookLM réside dans sa simplicité d'utilisation. Nul besoin de savoir prompter pour l'utiliser efficacement. L'IA simplifie grandement le travail en proposant de manière automatique la création de documents textuels adaptés au sujet (génération d'une FAQ, d'un guide d'étude, d'un sommaire, d'une timeline…).

Chaque nouvelle conversation ou nouveau documents généré automatiquement dans l'outil s'enregistre sous la forme d'une note. Il est ensuite possible d'éditer et de modifier la note ou encore d'y revenir plus tard. Enfin, l'aspect collaboratif de cette nouvelle app Google rend le tout encore plus fonctionnel dans un cadre professionnel. A la manière de l'ensemble des outils de la suite Workspace, chaque Notebook créé peut être partagé à des contacts, avec des droits de lecture ou d'écriture.

Une interface sobre et fonctionnelle

NotebookLM se présente sous la forme d'une interface sobre et fonctionnelle, comme Google sait les développer pour le grand public. A la création d'un Notebook, il est possible d'importer jusqu'à 50 sources textuelles, chacune pouvant comporter 500 000 mots (soit 25 millions de mots au total). Pour l'heure, NotebookLM supporte le copié / collé de texte brut, les url (Google crawl uniquement le texte), les documents Google Docs et Slides, les fichiers PDF et depuis peu les vidéos YouTube. Cas encore assez rare dans l'IA générative, NotebookLM prend en charge les PDF complexes avec des images et des graphiques. L'IA de Google est capable d'interpréter les images et les données complexes présente dans l'ensemble de ces documents.

L'ajout de source dans NotebookLM. © Capture d'écran / JDN

Une fois les sources importées, NotebookLM analyse automatiquement l'ensemble des documents et génère un résumé global ; il identifie les thèmes clés et crée des questions pertinentes sur le contenu. Le dashboard permet de choisir les sources à utiliser lors des échanges avec l'IA.

Dashboard principal de NotebookLM. © Capture d'écran / JDN

Au fil de nos différents tests l'IA NotebookLM n'a jamais halluciné. Le modèle se base toujours et de manière unique sur les sources et affiche les références pour chaque élément factuel avancé. L'IA sait également dire qu'elle ne sait pas quand l'information demandée n'était pas présente dans les documents sources.

La citation des sources est explicite © Capture d'écran / JDN

Générer son … propre podcast avec l'IA

C'est certainement la fonctionnalité la plus intrigante de NotebookLM. Depuis le 11 septembre dernier, il est possible de faire générer par l'IA un podcast complet. Plus précisément l'IA de NotebookLM génère un fichier audio de plusieurs minutes (environ 5 à 10 minutes selon nos tests) durant lequel deux interlocuteurs échangent de manière décontractée sur le sujet principal de vos sources. Le tout est assez ludique et véritablement bluffant. Intonation, onomatopée, hésitation… Nos deux interlocuteurs (un homme et une femme) semblent véritablement humains.

La discussion est véritablement dynamique et offre un vrai balayage des informations les plus importantes. L'outil est idéal pour s'imprégner rapidement d'un sujet complexe, d'une présentation, d'un article scientifique ou d'un rapport financier un peu poussé. Deux limitations persistent encore : le podcast est entièrement en anglais et aucune fonctionnalité de personnalisation n'est disponible.

Exemple d'un podcast généré à partir du rapport de la Commission de l'Intelligence Artificielle sur l'état de l'IA en France :

"Exemple d'un podcast généré"

Un produit imparfait mais prometteur

NotebookLM reste un produit perfectible, avec des lacunes en termes de personnalisation. On regrette notamment l'impossibilité de customiser les podcasts générés ou d'intégrer des sources multimodales (audio et vidéo). Malgré ces imperfections, l'outil s'annonce très prometteur. Google semble en effet miser gros sur ce projet, avec des mises à jour fréquentes apportant leur lot de fonctionnalités innovantes. Les équipes de développement paraissent particulièrement à l'écoute des utilisateurs. Fait rare pour un géant du numérique, Google a ouvert un serveur Discord dédié pour recueillir les retours des utilisateurs.

Dès à présent, NotebookLM offre des cas d'usage intéressants pour les professionnels. Que ce soit pour synthétiser rapidement un dossier complexe, préparer une présentation percutante ou s'imprégner efficacement d'un nouveau sujet via un podcast généré, l'outil trouve déjà sa place dans de nombreux workflows. Avec son potentiel d'évolution et l'implication de Google, NotebookLM pourrait bien devenir un incontournable de la productivité augmentée par l'IA.