Midjourney alpha sur le web : enfin une interface fonctionnelle

Midjourney propose à ses utilisateurs les plus fidèles une interface graphique simple et épurée.

Il était temps. Plus d'un an et demi après son lancement officiel en juillet 2022, Midjourney se dote, enfin, d'une interface utilisateur véritablement… utilisable. Officiellement lancée en décembre 2023, la version alpha de Midjourney sur le web est désormais accessible aux utilisateurs payants ayant déjà généré plus de 100 images. Jusqu'à présent, il était nécessaire de prompter l'IA dans un canal Discord, comme un administrateur de serveur Linux. Midjourney alpha simplifie grandement le processus : plus besoin d'accoler des dizaines de paramètres à la suite pour lancer la génération de son image.

Une interface sobre et fonctionnelle

Disponible à l'adresse midjourney.com/imagine, Midjourney alpha se concentre sur l'essentiel : proposer une interface utilisateur simple d'utilisation. On retrouve un champ textuel pour le prompt en place centrale. C'est ici qu'il faut entrer la description précise de l'image attendue. Pour remplacer les paramètres, jadis adressés sous forme de doubles tirets dans Discord, Midjourney propose une fenêtre à trois entrées : Image Size, Aesthetics et Model. Pour les non-initiés, le jargon et la configuration technique reste encore complexe. Détaillons ensemble l'incidence de ces paramètres.

Une image contenant texte, Visage humain, logiciel, Page web — L'interface de Midjourney Alpha. © Capture d'écran Midjourney / JDN

Size : pour régler la taille

Très classiquement dans Image Size, on retrouve une barre de sélection permettant de régler le ratio de l'image à générer. 11 tailles sont proposées : 1:2, 9:16, 2:3, 3:4, 5:6, 1:1, 6:5, 4:3, 3:2, 16:9, 2:1.

Aesthetic : pour régler le style d'image

L'onglet Aesthetic regroupe les trois principaux paramètres de personnalisation du style de l'image : Stylization, Weirdness et Variety. Dans le détail, Stylization (--stylise avec Discord) permet, sur une échelle de 0 à 1000, de régler la stylisation par Midjourney. Avec une valeur proche de 0, Midjourney respectera d'avantage le prompt. Une valeur proche de 1 000 offre, à contrario une liberté d'interprétation quasi-illimitée à l'IA. Par défaut, il est conseillé de garder une valeur proche de 100. Le paramètre Weirdness (--weird sur Discord), permet, sur une échelle de 0 à 3 000, de préciser le degré de singularité dans l'image attendue. Par défaut sur 0, l'augmentation de la valeur permet d'obtenir des résultats plus créatifs et loufoques. Midjourney conseille de modifier la valeur très progressivement en expérimentant autour de 250 à 500 pour éviter les résultats trop originaux.

Enfin, Variety (équivalent de –chaos sur Discord) permet sur une échelle de 0 à 100 de régler la différence entre les quatre images générées par Midjourney. Une valeur proche de 0 produit peu de variation quand une valeur proche de 100 produit des résultats complément différents entre les quatre images.

Model : pour régler les paramètres de génération

Dernier menu, Model permet de régler le mode génération : le modèle à utiliser, la vitesse de génération et la publicité des images. Précisément, le paramètre mode permet d'activer le mode raw (équivalent de –raw). Le mode raw, inspiré de la photographie, permet de générer des images plus brutes, sans la stylisation Midjourney. Les images en raw sont plus fades mais peuvent être, dans certains cas, plus photoréalistes. A noter que seuls les modèles 6 5.2 et 5.1 acceptent le mode raw.

Plus classiquement le paramètre Version permet de choisir la version du modèle à utiliser. Il est conseillé d'utiliser la version 6, la plus récente, qui offre les meilleurs résultats. Les versions antérieures doivent être réservées prioritairement aux professionnels qui utilisaient un pattern commun de prompting difficile à reproduire avec les nouveaux modèles. Speed permet de régler la vitesse de génération des images selon le plan d'abonnement choisi. Trois modes sont disponibles : relax (accès aux GPU avec liste d'attente), fast (accès en priorité aux GPU), turbo (utilise un pool expérimental de GPU plus rapide). Enfin l'activation du paramètre Stealth permet de rendre privé les images générées avec Midjourney.

A noter que l'interface de Midjourney alpha permet également d'uploader une image pour l'utiliser comme référence pour la génération d'un personnage (équivalent –cref sous Discord), utiliser le style de l'image comme référence (équivalent de –sref sous Discord) ou utiliser l'image directement dans le prompt (pour l'adapter ou la modifier).

Des progrès restent à faire

Cette version web devrait permettre à Midjourney de toucher un public plus large, au-delà des professionnels de l'image et des utilisateurs techniques à l'aise avec Discord. L'IA générative d'image pourrait ainsi s'immiscer plus facilement dans les entreprises et les métiers moins technophiles. Midjourney alpha reste toutefois en retrait par rapport à un concurrent comme DALL-E 3 d'OpenAI en termes de simplicité. Si le prompt en langage naturel est central, les paramètres avancés demeurent techniques et potentiellement déroutants pour un néophyte. DALL-E mise tout sur le prompt textuel là où Midjourney conserve de nombreux réglages complexes.

Malgré tout, cette nouvelle interface web constitue une avancée majeure pour démocratiser Midjourney au-delà de sa base d'utilisateurs historiques. Gageons que les futures versions iront encore plus loin dans la simplification pour toucher le plus grand nombre.