ChatGPT peut générer des prompts précis et détaillés pour Midjourney. Il suffit de fournir au chatbot une documentation fournie. Explications.

ChatGPT à la rescousse de Midjourney. Depuis la publication de son intelligence artificielle en juillet 2022, Midjourney a connu une croissance exceptionnelle. Fascinés par les possibilités de génération et la qualité des images produites, de nombreux professionnels ont intégré l'outil à leur workflow quotidien. Mais pour générer une photographie, un dessin ou une peinture, il est nécessaire d'utiliser un prompt, une commande textuelle descriptive permettant à l'intelligence artificielle de comprendre le visuel attendu.

Chaque paramètre doit être précisé avec deux tirets à la fin du prompt, à la manière d'une ligne de commande. Pour générer une image au format 16:9, il est ainsi nécessaire de préciser "--ar 16:9" en fin de prompt. Au fil des mois et des avancées techniques de l'IA, les paramètres se sont multipliés et complexifiés au point d'exiger une véritable expertise, plus d'un an après le lancement de l'IA. Or, pour simplifier grandement l'étape de création du prompt, il est possible de recourir à GPT-4. L'intelligence artificielle étant en capacité d'apprendre de nouvelles connaissances et de générer du texte, il suffit de lui apprendre à créer des prompts. En fournissant la documentation complète de Midjourney au chatbot d'OpenAI et quelques exemples, ce dernier sera en capacité de générer des prompts viables et pertinents.

Fournir une documentation complète

Selon nos tests, la génération de prompt pour Midjourney semble aujourd'hui fonctionner uniquement avec GPT-4. Les utilisateurs de la version gratuite de ChatGPT, avec GPT-3.5 n'obtiendront pas de résultats probants. La première étape consiste tout d'abord à nourrir GPT-4 de la documentation complète de Midjourney en lui indiquant la finalité des documents. Voici le prompt que nous utilisons pour faire ingérer le corpus textuel à l'IA : "Tu vas nous aider aujourd'hui à créer un prompt précis et créatif pour l'outil de génération d'images par intelligence artificielle Midjourney. Ci-dessous, voici des documents qui t'aideront à comprendre les commandes et leur finalité. Analyse et retiens l'ensemble des instructions."

Il est nécessaire de donner toute la documentation de Mijourney à ChatGPT. © JDN

Dans le cadre de ce test, nous utilisons la documentation officielle fournie par Midjourney. Formules grammaticales, liste des paramètres, fonctionnalités avancées, versions utilisées… Le but est de fournir le plus d'éléments techniques possibles à ChatGPT pour qu'il comprenne l'utilité de chaque argument. La version web de GPT-4 n'étant pas en mesure d'accepter les longs messages, il sera nécessaire de soumettre en plusieurs fois les documents d'apprentissage au chatbot. Les instructions et la contextualisation de la mission doivent être ajoutées au début de chaque nouveau message.

Une solution alternative consiste à utiliser le plugin Web Requests pour automatiser le crawl de ChatGPT et éviter de copier / coller le contenu à la main. Nous vous conseillions à minima de scraper les URL suivants :

https://docs.midjourney.com/docs/prompts

https://docs.midjourney.com/docs/explore-prompting

https://docs.midjourney.com/docs/models

https://docs.midjourney.com/docs/parameter-list

Utiliser un plugin de scraping est plus simple et rapide. © Capture d'écran

Enfin, afin d'ajouter une couche de compréhension supplémentaire, nous recommandons de donner à ChatGTP un large corpus de prompts déjà créés par le passé, pour qu'il comprenne le format et les mécaniques récurrentes. De nombreux sites tels que freemidjourneyprompt.com ou prompthero.com proposent notamment des prompts complets.

Définir des objectifs clairs

La seconde et dernière étape consiste à expliciter vos attentes. Dans le cadre de ce test, nous demandons à ChatGPT d'agir comme un graphiste expérimenté en intelligence artificielle, et d'imaginer un prompt "fiable" et "précis" pour Midjourney. Nous indiquons ensuite à l'IA de s'appuyer exclusivement sur les documents fournis précédemment dans la conversation. Nous demandons au chatbot une description complète et technique, pour parvenir à une "création originale et de très haute qualité", tout en utilisant les paramètres de son choix et sa propre vision artistique. Nous indiquons qu'il est indispensable que le prompt soit en anglais, et précisons le format attendu, 16:9 dans notre cas. Enfin, nous finissons par décrire très simplement l'image demandée.

ChatGPT va alors utiliser les informations précédentes pour créer un prompt, détaillé, clair et inspirant. Les paramètres seront ajoutés par l'IA en fonction de ses besoins créatifs. Si le prompt initial soumis à ChatGPT est peu inspirant, le prompt généré sera de faible qualité. Pour obtenir un meilleur résultat, il est nécessaire de rajouter un nombre minimal de mot dans le prompt, 120 étant un bon début. Une fois le prompt créé par GPT-4, il suffit de le copier / coller dans la console Discord de Midjourney et le tour est joué. Voici le résultat dans notre cas :

Pour vos futures demandes, inutile de retaper les dernières instructions. L'IA sera capable de comprendre qu'il s'agit d'une nouvelle demande et de réitérer les règles précédentes. Attention toutefois, après un certain nombre de messages ChatGPT a tendance à oublier les instructions précédentes. Dans ce cas, il est nécessaire de reproduire l'ensemble des étapes dans une nouvelle conversation. Petite astuce supplémentaire, si vous souhaitez revenir et utiliser cette conversation plus tard, il est possible de créer un lien vers la conversation depuis l'interface et de l'ajouter à vos favoris. Pour plus de facilité, voici un lien vers notre conversation ChatGPT avec l'ensemble des prompts évoqués.