Mistral Next, l'énigmatique "ChatGPT à la française" de Mistral AI

Mistral AI teste actuellement un nouveau large language model (LLM) nommé Mistral Next. Le déploiement officiel devrait avoir lieu dans les prochains jours.

Une agitation fébrile secoue l'univers de l'IA open source. Mistral AI serait sur le point de dévoiler un nouveau modèle d'IA concurrent de ChatGPT. Depuis la semaine dernière, vraisemblablement le 16 février, la plateforme d'évaluation de LLM "LMSYS Chatbot Arena", permet de tester un nouveau modèle : Mistral Next. Mais aucune information officielle n'est sortie depuis l'apparition du LLM sur la plateforme, cultivant ainsi le mystère.

Mistral AI serait dans les "starting-blocks"

Comme le soulignent plusieurs experts de la plateforme, l'implémentation même du modèle est assez étrange. Contrairement à Mistral Medium, il n'existe aucune trace de Mistral Next sur le repository (dépôt) de LMSYS. En revanche, Mistral Next apparait sur le repository de Dust, une jeune start-up française spécialisée dans la conception d'agents IA. L'implémentation technique du modèle nous apprend qu'il s'agirait d'un modèle de grande taille disposant d'une taille de contexte de 32 000 tokens, comme Mistral Medium.

Mistral Next serait-il un modèle servant de base pour l'arrivée imminente d'un futur ChatGPT à la Française ? C'est ce qu'affirment nos confrères du Canard enchaîné dans l'édition de ce mercredi 21 février 2024. Dans un article intitulé "Intelligence artificielle : Macron joue à fond Mistral gagnant", Odile Benyahia-Kouider et Christophe Labbé nous apprennent que Mistral AI serait dans les "starting-blocks" pour lancer la version made in France du célèbre chatbot d'OpenAI. D'après les informations de nos confrères, le lancement officiel du modèle serait prévu pour la semaine du 26 février, si le calendrier ne change pas. Toujours selon nos confrères, le supercalculateur "Nabuchodonosor", récemment acheté par Scaleway, aurait été utilisé pour l'entrainement du modèle.

Des capacités conversationnelles améliorées

Nous avons pu essayer la version actuellement déployée de Mistral Next sur LMSYS. Selon nos tests, les performances en matière de génération de texte sont supérieures à GPT-3.5 mais encore inférieures à GPT-4, notamment en Français. Mistral Medium pèche encore sur la génération de texte : le champ lexical est peu varié et le vocabulaire assez imprécis. En génération de code, Mistral Medium offre de belles performances et se révèle aussi performant que GPT-3.5.

A gauche Mistral Next, à droite GPT-4 avec le prompt : "Génère un article de 1 000 mots sur les grandes tendances de l'IA en 2024." © Capture d'écran

Les premiers résultats démontrent une capacité conversationnelle légèrement plus développée qu'avec les précédents modèles développés par Mistral AI. De premiers tests qui ne présagent en rien le succès du modèle dévoilé dans les prochains jours. Les premiers retours seront très certainement pris en compte d'ici sa sortie officielle pour améliorer encore un peu plus le modèle.

Le déploiement du modèle sur le Chatbot Arena de LMSYS permet à Mistral d'obtenir de précieux retours avant la mise en production générale du modèle. Alors que le monde de l'IA continue d'être dominé par les géants américains Mistral AI pourrait bien créer la surprise avec son nouveau modèle Mistral Next. Pour l'heure, le modèle garde une part de mystère et continue d'alimenter les spéculations. Une chose est sûre, l'IA française n'a pas dit son dernier mot.