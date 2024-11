La start-up parisienne dévoile une version enrichie d'une flopée de nouvelles fonctionnalités de son assistant grand public, Le Chat. Un nouveau modèle multimodal à l'état de l'art fait également son apparition.

Mistral AI fait un nouveau pas en avant. "Evoluer d'une entreprise scientifique vers une entreprise alliant science et produit n'était pas une mince affaire. Ce changement représente une étape vraiment significative dans notre parcours", se félicite Arthur Mensch, CEO de la start-up sur X. Et pour cause, Mistral a dévoilé ce lundi 18 novembre une alternative crédible à ChatGPT. Le Chat, le chatbot grand public de l'entreprise, s'enrichit de nouvelles fonctionnalités. Mistral dévoile également un nouveau modèle de référence spécialisé dans la vision.

Le Chat passe dans une nouvelle dimension

La nouvelle version du Chat offre peu ou prou les mêmes fonctionnalités que ChatGPT. Mistral AI introduit notamment la recherche web avec citations. L'utilisateur peut ainsi questionner le chatbot qui ira ensuite crawler le web pour répondre précisément à sa demande. Un mode Canvas est également intégré pour éditer et modifier directement du code ou du texte de façon intuitive et rapide. Le Chat s'enrichit aussi d'un nouveau mode avancé de compréhension des documents PDF complexes (graphiques, images, courbes). Un nouveau mode supporté par Pixtral Large, le nouveau flagship multimodal open source de Mistral (lire ci-après).

Mistral AI annonce également la signature d'un partenariat avec Black Forest Labs. Un partenariat qui permet à Mistral de proposer dans Le Chat la génération d'images native avec le flagship text-to-image de Black Forest, Flux Pro. Ce dernier (aussi utilisé par Grok) offre selon nos tests une qualité d'image avancée notamment avec le style photoréaliste. Pour finir, Mistral met à disposition de ses utilisateurs un espace pour configurer des agents très basiques en utilisant l'ensemble des outils cités précédemment.

Pour l'heure, l'ensemble des nouvelles fonctionnalités de Le Chat sont encore en beta. Elles sont accessibles gratuitement sous réserve de disponibilité des ressources. Les équipes travaillent sur une version payante de l'outil avec des garanties minimales de service.

Avec Pixtral Large, Mistral frappe (encore) très fort

En parallèle de l'annonce du nouveau Le Chat, Mistral annonce Pixtral Large, un nouveau modèle d'IA open source orienté vision. Développé sur la base de Mistral Large 2, le nouveau Pixtral comptabilise 124 milliards de paramètres. Il est, selon Mistral, à l'état de l'art en matière de vision. Le modèle excelle notamment sur DocVQA (Questions-Réponses sur des documents visuels) avec un score de 93,3% et sur AI2D (compréhension de diagrammes) avec 93,8%, se positionnant comme leader sur ces benchmarks parmi les modèles comparés. Il démontre également une forte capacité sur ChartQA (analyse de graphiques) avec 88,1%.

En clair, Pixtral Large est particulièrement adapté pour des applications professionnelles nécessitant une analyse précise de documents, diagrammes et graphiques complexes, ainsi que pour la compréhension générale d'images. Sa performance avec Mathvista (69,4%) indique également de bonnes capacités à traiter des problèmes mathématiques visuels (géométrie, analyse de diagramme…). Il surpasse notamment, toujours selon Mistral, GPT-4o et Gemini 1.5 Pro sur la majorité des benchmarks visuels.

Le modèle est particulièrement efficace pour l'OCR et peut ensuite raisonner de manière assez complexe. Enfin sur la partie textuelle, Pixtral Large fait aussi bien que Mistral Large 2. A noter que le modèle est publié sous la licence de recherche Mistral pour une utilisation à des fins de recherche ou éducative et sous la licence Mistral Commercial à des fins commerciales. Il est possible d'utiliser le modèle sur Le Chat, via l'API de Mistral, ou en téléchargeant les poids depuis Hugging Face.

Enfin, Mistral AI profite également de l'occasion pour mettre à jour son modèle Mistral Large. La mise à jour apporte notamment une meilleure compréhension des contextes longs, et une meilleure accuracy sur l'appel de fonction. Le modèle serait particulièrement performant en utilisation dans un système agentique ou pour du RAG en entreprise.