Nano Banana Pro : que vaut le modèle d'image de Google pour les pro ?

Avec Nano Banana Pro, Google rend son modèle d'image accessible aux cas d'usage professionnel.

Si beaucoup s’attendaient à une annonce simultanée avec Gemini 3, Google en a décidé autrement. Présenté le 20 novembre, NanoBana Pro dote les professionnels du graphisme, du marketing et de la communication d’outils avancés pour générer des visuels de haute qualité et modifier des créations existantes. Grâce à une gestion très précise du texte, à un suivi de prompt nettement amélioré et à une sortie 4K, NanoBana Pro a tout pour convaincre un large public de professionnels. Le JDN a pu tester le nouveau modèle, en génération comme en édition.

Un modèle basé sur Gemini 3 Pro

Nano Banana Pro, également connu sous le nom de Gemini 3 Pro chez DeepMind, repose (comme son nom l’indique) entièrement sur l’architecture de Gemini 3 Pro. Le modèle est, comme son équivalent, nativement multimodal et capable de raisonner pour créer ou modifier des visuels. Il serait nettement plus précis grâce à l’analyse multimodale avancée de Gemini 3. Comme Gemini 3 Pro, Nano Banana Pro a été entraîné sur des données antérieures à janvier 2025. Et, à l’image de la première version de Nano Banana, les contenus générés intègrent un watermark SynthID invisible destiné à authentifier les productions a posteriori.

Nano Banana Pro est présenté par Google comme le modèle le plus avancé au monde pour la création et l’édition de texte dans les images. Le modèle peut désormais générer une grande variété de textes, dans des polices, langues et tailles très diverses. Il serait particulièrement performant pour produire des schémas explicatifs, des posters ou toute création nécessitant une intégration textuelle fine. La cohérence entre les images fournies est également renforcée : il est possible d’uploader jusqu’à 14 images simultanément, que le modèle parvient à intégrer proprement et de manière homogène dans la totalité des cas présentés par Google. Nano Banana Pro offre aussi la possibilité d’éditer tous les aspects visuels d’une image : angle de vue, color grading, transformation d’une scène, modification ou suppression d’éléments. La seule limite reste l’imagination. Mais l’innovation la plus marquante pour les professionnels est, sans aucun doute, l’arrivée de la 4K. Un atout majeur pour le marketing, la publicité extérieure et tout support nécessitant un rendu très détaillé.

Par ailleurs, le fait que Nano Banana Pro soit basé sur Gemini 3 permet au modèle d’utiliser des outils pour mieux comprendre le contexte et s’appuyer sur le web pour générer des images, par exemple en fournissant un lien en ligne comme référence.

Le test du JDN

Pour l’occasion, le JDN a décidé de tester Nano Banana sur quatre cas d’usage différents, en génération comme en édition d’images. Et les résultats sont à la hauteur.

Une coupe transversale du cerveau

Prompt : Générer une coupe transversale anatomique détaillée du cerveau humain. Représenter fidèlement les structures internes selon la neuroanatomie réelle : cortex cérébral (différenciation substance grise/substance blanche), corps calleux, thalamus, hypothalamus, hippocampe, amygdale, noyaux gris centraux (putamen, noyau caudé, globus pallidus), cervelet, tronc cérébral (mésencéphale, pont, bulbe), ventricules cérébraux et réseau vasculaire principal. Ajouter des flèches d’annotation nettes pointant vers chaque région et expliquer précisément sa fonction : intégration sensorielle, motricité, mémoire, émotions, coordination, régulation autonome, etc. Style : schéma technique clair, lisible, pédagogique, avec annotations propres et cohérentes. La représentation doit rester la plus fidèle possible aux atlas neuroanatomiques de référence.

A première vue, la version Pro nécessite davantage de temps pour générer une image que la première version de Nano Banana. Il faut parfois patienter plusieurs minutes pour obtenir un visuel complet. Le modèle raisonne étape par étape (mode CoT), ce qui augmente considérablement la précision, mais rallonge logiquement le délai de génération. Le rendu final est irréprochable sur le plan textuel : aucune faute, aucune déformation, aucune anomalie typographique. Le schéma est cohérent, propre et parfaitement fonctionnel. La seule imperfection relevée concerne les flèches, générées en double sens alors que des flèches à sens unique étaient attendues. Un simple prompt secondaire permet toutefois de corriger le problème.

Une affiche publicitaire dans une rue de Paris

Prompt : Créer une affiche publicitaire photoréaliste d’une bouteille de Coca-Cola très fraîche, avec condensation visible, étiquette parfaitement nette et reflets réalistes, dans un style conforme à une campagne professionnelle. L’affiche doit être intégrée à proximité des Galeries Lafayette, avec une perspective urbaine crédible, l’architecture haussmannienne reconnaissable, les vitrines du quartier et un éclairage naturel cohérent avec la scène. Le panneau publicitaire doit être parfaitement fusionné dans l’environnement (abribus ou panneau rétroéclairé) sans artefacts. Le texte « Coca-Cola » doit apparaître dans sa typographie exacte et sans déformation, avec un rendu propre et haute résolution. L’atmosphère doit être nette, réaliste, et la composition doit restituer la qualité d’une publicité premium, avec une mise au point précise sur l’affiche et un arrière-plan légèrement adouci mais fidèle à la rue réelle.

Le résultat est tout simplement bluffant. Nano Banana Pro s’exécute parfaitement et génère exactement le visuel demandé, ni plus ni moins. Même la typographie caractéristique des Galeries Lafayette est reproduite à la perfection. L’image aurait très bien pu être prise par un photographe : rien ne laisse deviner qu’il s’agit d’une production IA. Le seul bémol concerne la luminosité de la publicité elle-même, légèrement trop forte par rapport à l’ambiance générale de la scène. Mais là encore, un simple ajustement du prompt suffirait à corriger ce point.

Transformer une photo de jour en nuit

Prompt : Transformer cette photographie en véritable scène nocturne, avec une ambiance clairement identifiable comme de nuit. Les lampes doivent être allumées et produire une lumière chaude, réaliste, avec des ombres cohérentes et une diffusion naturelle. Le rendu global doit rester photoréaliste : contraste renforcé, teintes nocturnes crédibles, éclairage intérieur ou extérieur adapté, détails visibles malgré la faible luminosité, et aucune sur-saturation. L’image finale doit donner l’impression d’une photo réellement prise la nuit, avec un réalisme visuel maximal.

L’image générée est globalement cohérente et restitue correctement l’ambiance nocturne. Cependant, plusieurs éléments mettent en évidence les limites de Nano Banana Pro, ce qui était précisément l’objectif du test. Les sponsors présents sur l’image originale ne sont pas reproduits fidèlement. Le modèle n’a probablement pas pu lire ou analyser avec précision les détails visuels, en raison d’une résolution d’entrée insuffisante. Il génère alors ce qui lui semble le plus probable, sans être certain du contenu exact à reproduire. Plus gênant encore, la disposition générale de la scène est partiellement modifiée : certains personnages n’apparaissent pas dans la même position que sur la photo d’origine, tandis que d’autres sont ajoutés. Dommage.

Générer une BD avec une image de référence

Prompt : Créer une planche de bande dessinée pour enfants en plusieurs cases, en style comics inspiré de Marvel, avec un encrage propre, des cadrages dynamiques et des compositions lisibles, mais en noir et blanc uniquement (sans aucune couleur) et avec un trait relativement fin, doux et organique. Utiliser comme référence stricte les images du lapin que je fournis : conserver sa morphologie exacte, ses proportions, la forme de sa tête, de ses oreilles, de ses yeux, ainsi que son expression habituelle et son pelage. Le décor est celui d’une petite maison chaleureuse mais minimaliste : panier en osier, tapis, table basse, bol de salade, panier de carottes, râtelier de foin, quelques meubles discrets. L’histoire se déroule sur une seule journée. Le matin, le lapin se réveille dans son panier, s’étire et se redresse, encore un peu endormi. Puis il part explorer le salon, renifle le tapis, se dresse sur ses pattes arrière pour regarder par-dessus la table basse et découvre un bol de salade à qui il dit « Bonjour, salade, bien dormi ? ». Dans les cases suivantes, il s’assoit face au bol comme s’il discutait avec un ami, fait une courte pause comme s’il écoutait une réponse, puis grignote quelques feuilles en expliquant qu’il a besoin de force pour sa grande journée. Plus tard, il trouve un petit panier avec des carottes, les aligne devant lui et les salue : « Vous aussi, les carottes, vous êtes prêtes pour l’aventure ? ». Il imagine leur raconter qu’il a rêvé d’un grand jardin et les observe avec admiration avant d’en croquer un morceau. Ensuite, il se rend près de son râtelier de foin, enfouit doucement la tête dedans et murmure que le foin est son ami le plus sage, « toujours là, tous les jours ». En fin d’après-midi, il est allongé sur le tapis, le ventre posé au sol, les pattes arrière étirées, l’air tranquille et rassasié, parlant tout bas à la salade, aux carottes et au foin comme s’ils formaient une petite bande de compagnons. La dernière case le montre de retour dans son panier, les yeux qui se ferment, pendant qu’il chuchote qu’il a passé « une très grande journée » avec ses amis. Les expressions du lapin doivent rester subtiles, crédibles et attendrissantes (pas de caricature extrême), avec une mise en scène façon BD Marvel : angles variés, quelques gros plans sur le museau ou les yeux, mais une ambiance globale douce, claire et facilement compréhensible par un enfant.

Le visuel final généré est globalement cohérent et reproduit très fidèlement les traits du lapin fourni, y compris ses mimiques, restituées avec une précision remarquable. On note toutefois un point problématique : une tache, qui ressemble à un amas de poils, apparaît sans raison apparente dans la partie supérieure centrale de l’image. Par ailleurs, la cinquième bulle est vide et partiellement incomplète. Malgré ces défauts mineurs, l’ensemble demeure très cohérent et presque production ready. Avec quelques ajustements du modèle, Nano Banana Pro devrait être capable de produire des planches extrêmement réalistes du premier coup.

Un pricing premium

Nano Banana Pro est cher, très cher même, surtout pour un modèle encore en préversion. La génération d’images est facturée environ 0,134 $ pour une image 1K/2K et jusqu’à 0,24 $ pour une image 4K. Et, détail qui revient de plus en plus dans les discussions, les images ratées, floues, incorrectes, ou simplement non conformes au prompt sont également facturées.

Malgré ce coût élevé, l’expérience montre que Nano Banana Pro a une vraie marge d’avance. La cohérence visuelle, la compréhension du contexte, la précision des textes dans l’image, la stabilité dans les détails et la capacité à suivre des instructions complexes en font un modèle qui se rapproche déjà d’un niveau studio. Les erreurs existent, mais elles restent minoritaires, et surtout, corrigibles avec un prompt mieux calibré. Il est donc difficile d’imaginer que les professionnels ne l’intègreront pas très rapidement dans leurs workflows. Nano Banana Pro coche quasiment toutes les cases, et confirme encore une fois la capacité de Google à imposer de nouveaux standards dans l’IA générative. Un modèle cher, exigeant… mais incontestablement excellent.

Un modèle basé sur Gemini 3 Pro

Le test du JDN

Une coupe transversale du cerveau

Une affiche publicitaire dans une rue de Paris

Transformer une photo de jour en nuit

Générer une BD avec une image de référence

Un pricing premium