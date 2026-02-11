FLUX.2 [klein] offre une alternative on-device à Nano Banana Pro de Gemini pour l'édition d'images.

C’est encore une performance signée Black Forest Labs. La start-up allemande spécialisée dans l’IA générative appliquée à l’image a dévoilé mi-janvier un nouveau modèle capable, sur le papier, de rivaliser avec les modèles d’édition d’image américains (Nano Banana Pro ou gpt-image-1.5 d’OpenAI). Sa force ? Le modèle peut être utilisé en local sur votre machine, sans nécessiter d’envoyer vos images dans le cloud. Deux versions sont proposées : une version Apache 2.0 (libre de toute utilisation) et une version sans utilisation commerciale (à poids ouvert).

Une version 4B et 9B, deux licences

Black Forest Labs déploie donc deux modèles distincts pour couvrir l'ensemble des besoins : une version compacte de 4 milliards de paramètres et une version premium de 9 milliards de paramètres. La version 4B offre une liberté totale d'utilisation, y compris commerciale, sans restriction particulière. Le modèle exige environ 8,4GB de VRAM pour le modèle quantizé (9,2GB pour la version base). Son principal atout réside dans son temps d'inférence particulièrement rapide. Black Forest parle d’environ 0,3 seconde sur Nvidia GB200 et 1,2 seconde sur RTX 5090 pour la version distillée. Sa taille relativement modeste pour un modèle d’image, restreint en revanche la qualité d’image. Le modèle excelle néanmoins dans les cas d'usage nécessitant une latence minimale, pour des éditions minimes dans les images.

De son côté, la version 9B représente le fleuron de la gamme. Il est capable de rivaliser avec des modèles cinq fois plus volumineux. Même si les poids sont disponibles en open source, sur Hugging Face, l’usage du modèle est contraint par la “Non-Commercial License.” Cette dernière autorise exclusivement les usages non commerciaux, de recherche, de test ou à des fins caritatives. Pour toute exploitation commerciale, l'acquisition d'une licence payante devient obligatoire. La licence démarre à 199 dollars pour 10 000 images (soit 0,02 dollar par image). A titre de comparaison, Gemini facture son API de génération d'images 0,134 dollar par image en 1K/2K de résolution et 0,24 dollar en 4K, soit environ 1 340 à 2 400 dollars pour 10 000 images générées. Côté hardware, le modèle exige 19,6GB de VRAM environ pour la version quantizée (21,7GB pour la base).

Le test du JDN

Pour évaluer les performances réelles de FLUX.2 [klein], nous avons choisi d'utiliser la version 9B non quantizée, la plus performante du catalogue Black Forest Labs. L'objectif est de confronter le modèle au leader actuel de l'édition d'images, Nano Banana Pro de Gemini, sur quatre cas d'usage concrets.

1. Changer la couleur d’un élément : le point pour Klein

Pour ce premier cas d’usage, nous allons commencer en mode facile en changeant simplement la couleur d’un élément présent dans une image. Nous allons ici modifier la couleur de ce Rafale, pour passer de gris à un rouge amarante.

© Pixabay

Prompt : Change la couleur de l'avion en rouge amarante tout en préservant exactement les reflets lumineux du soleil sur les ailes et le fuselage.

FLUX.2 [klein] Nano Banana Pro

FLUX.2 [klein] remporte clairement ce premier test. Le modèle parvient à appliquer le rouge amarante tout en préservant les reflets lumineux originaux, notamment sur le cockpit et la partie supérieure du fuselage. A l'inverse, Nano Banana Pro uniformise trop la couleur et écrase les détails, perdant (un peu) le réalisme de la scène.

2. Remplacer un personnage : Nano Banana devant

Plus complexe, nous demandons à l’IA de remplacer un humain dans une image, le tout proprement. Pour cet exemple, nous partons d'une photographie classique : un couple marchant dans une clairière. L'objectif est de remplacer la femme par une danseuse de ballet en tenue complète - tutu blanc, chignon serré, chaussons de pointe - tout en conservant l'essence de la scène originale.

© Pixabay

Prompt : remplace la femme de gauche par une danseuse de ballet classique en tenue complète : tutu blanc, chignon serré, chaussons de pointe roses. Conserve exactement la position avec l'homme, l'angle du corps et la dynamique du couple.

FLUX.2 [klein] Nano Banana Pro

L’image générée par FLUX.2 klein crée certes une composition spectaculaire, mais détruit complètement la dynamique initiale du couple qui marchait ensemble. Nano Banana Pro maintient la scène de base, tout en intégrant les éléments ballet (tutu visible, posture). Le point est donc accordé à Nano Banana.

3. Ajouter un élément externe : Nano Banana encore devant

L'exercice se corse, il s'agit maintenant d'introduire un objet totalement étranger à une scène, tout en maintenant une cohérence visuelle parfaite. Pour cette démonstration, nous partons d'une route désertique américaine s'étendant à perte de vue et y ajoutons un piano à queue de concert.

Prompt : Ajoute un piano à queue noir brillant (type concert) posé au milieu de la route déserte, à environ 50 mètres de la caméra. Le couvercle est relevé, le clavier visible. Intègre naturellement cet élément surréaliste tout en conservant la perspective de la route, les lignes blanches de marquage, les montagnes rougeâtres à l'horizon, le ciel sans nuages, et l'atmosphère.

© Pixabay

FLUX.2 [klein] Nano Banana Pro

FLUX.2 [klein] a totalement réinterprété la scène en modifiant le ciel, l'atmosphère lumineuse et en accentuant les tons rouges des montagnes. Nano Banana Pro ajoute le piano tout en préservant le ciel orangé original et l'ambiance de coucher de soleil. Seul point positif pour Klein, l’intégration du piano est techniquement supérieure : les reflets sur l'instrument, l'ombre portée et l'ancrage visuel sur la route sont plus convaincants.

4. Transformation jour/nuit : Klein de retour

Pour ce dernier test, nous demandons à l’IA de transformer une photographie de jour en photographie nocturne. En l'occurrence en passant de Stonehenge avec une lumière de pleine journée à une lumière nocturne tamisée de pleine lune.

© Pixabay

Prompt : Transforme cette scène diurne en nuit de pleine lune. Remplace le ciel bleu par un ciel nocturne profond avec une pleine lune brillante positionnée au-dessus du cercle de pierres.

FLUX.2 [klein] Nano Banana Pro

klein est photographiquement plus réaliste. Par une nuit de pleine lune en contre-jour, Stonehenge apparaîtrait, très certainement, en silhouette de cette manière. C'est exactement ce qu'on obtiendrait en photo réelle. Nano Banana Pro garde artificiellement trop de détails et de texture sur les pierres alors qu'elles devraient être dans l'ombre. Klein respecte la physique de la lumière nocturne, même si cela sacrifie les détails de la scène originale.

Dans quel cas utiliser FLUX.2 [klein] ?

Nano Banana Pro garde une belle avance sur FLUX.2 [klein], notamment dans sa capacité à préserver la cohérence exacte de la scène originale, un critère qui reste fondamental en édition d'images. Sur nos quatre tests, le modèle de Google préserve systématiquement la structure, l'atmosphère et la dynamique de l'image source, là où Klein a une fâcheuse tendance à réinterpréter la scène à sa sauce. Concrètement, Nano Banana Pro reste le choix à faire quand vous avez besoin d'une précision chirurgicale sur la composition initiale, même si le rendu final peut parfois manquer de finesse. Klein, à l'inverse, produit des résultats visuellement plus aboutis sur le plan du réalisme et des textures, mais au prix d'une fidélité moindre à l'image d'origine. Il faudra alors accepter de multiplier les itérations pour obtenir un résultat qui combine qualité visuelle et respect du cadre initial.

Mais la vraie force de FLUX.2 [klein] se joue sur un autre terrain. Côté tarifaire d'abord, le modèle s'impose comme une option nettement plus économique, particulièrement adaptée au traitement par lots. Mais l'argument clef est sans doute celui de la souveraineté des données. Contrairement à Nano Banana Pro qui impose de transiter par les serveurs cloud américains de Google, FLUX.2 [klein] s'exécute intégralement en local sur votre propre infrastructure. Aucune image n'est envoyée à l'extérieur. Un avantage considérable à l'heure de la souveraineté numérique.