Google lance Nano Banana 2, un modèle d'image plus intelligent et plus rapide

Nano Banana 2 apporte une meilleure cohérence visuelle, des effets textuels plus précis et une rapidité d'exécution encore améliorée.

Après sa mise à jour de Gemini 3 vers Gemini 3.1, DeepMind fait évoluer son modèle d’images phare. Le laboratoire de Google, basé à Londres, annonce l’arrivée ce jeudi 26 février de Nano Banana 2, qui devrait progressivement remplacer son petit frère Nano Banana Pro. Gemini 3.1 Flash Image, de son nom technique, allie, selon DeepMind, la vitesse d’un modèle flash et la précision d’un modèle Pro. Le modèle, à l’état de l’art chez Google, apporte des avancées notables en cohérence visuelle, contrôle, et précision des sorties textuelles.

La connaissance des modèles Gemini

La vraie force des modèles Nano Banana provient de la richesse du texte et de la compréhension du modèle. Quand beaucoup d’autres modèles sont basés sur une architecture à diffusion, Nano Banana se base sur un modèle Gemini (en l'occurrence ici Gemini 3.1 Flash) avec un fine-tuning spécifique pour la création d'images. L’utilisation d’un modèle générique permet de raisonner sur du texte et donne la capacité à l’IA de “comprendre” ce qu’elle génère. Le modèle s’appuie ainsi sur les connaissances de Gemini et le search en temps réel pour générer des sujets spécifiques avec plus de précision. Nano Banana 2 apporte justement des textes plus précis dans les images générées. Il est maintenant possible de traduire directement du texte dans une image.

Une infographie générée avec Nano Banana 2. © Google DeepMind

Plus encore, le modèle adopte une meilleure consistance des sujets lors de la génération d’images. Il est possible de générer jusqu’à 5 personnages identiques et 14 objets à travers plusieurs générations d'images successives, sans que l’IA ne commence à changer leurs détails physiques.

La consistence des sujets est excellente. © Google DeepMind

Le modèle parvient également à mieux capter les nuances dans votre prompt initial et à les refléter ainsi plus fidèlement en sortie. Nano Banana 2 apporte également des lumières plus naturelles, des textures plus riches et des détails plus nets (sensation de piqué). Les résultats de Nano Banana 2 peuvent être générés dans des résolutions allant de 512px à 4000 px, comme la version Pro.

Nano Banana 2 déployé simultanément chez Google

Nano Banana 2 est déployé dès ce 26 février dans l’application Gemini, avec les modes Fast, Pro et Thinking. Les utilisateurs AI Pro et Ultra conservent toutefois un accès à Nano Banana Pro. Le modèle va également être déployé dans le Search (hors France), dans AI Studio (y compris l’API) ainsi que dans GCP dans Vertex AI et Gemini CLI. Le modèle de génération de vidéo Flow utilisera également le modèle pour générer ses visuels. A l’heure d’écrire ces lignes, Google n’a pas communiqué de prix officiel pour son utilisation via l’API.