Mistral AI, pourquoi tant de secret ?

Mistral AI, pourquoi tant de secret ? Issus des meilleurs labos de recherche en intelligence artificielle du monde, trois Français développent un grand modèle de langage open source et souverain. Une initiative aussi secrète qu'ambitieuse.

La France et l'Europe vont-elles enfin prendre leur revanche technologique sur l'Oncle Sam ? OpenAI, Deepmind, Anthropic… Les stars de l'intelligence artificielle sont, pour l'heure, majoritairement installées aux Etats-Unis. La Chine, avec Baidu, Alibaba et Tencent, commence également à tirer son épingle du jeu. En Europe, plusieurs start-up expérimentent et essayent d'innover mais les moyens manquent. Pour tenter de contrer la domination américaine, trois experts de l'intelligence artificielle s'attellent depuis avril 2023 à développer des modèles en mesure de concurrencer les poids lourds du secteur.

Des chercheurs de renom

Immatriculé le 24 avril dernier auprès du greffe du tribunal de Paris, Mistral AI est fondé par Arthur Mensch, ancien de DeepMind, le laboratoire de recherche en IA de Google, Timothée Lacroix, ex-collaborateur de l'AI Research Lab de Meta, et Guillaume Lample, également passé par la maison mère de Facebook. L'équipe de choc s'est très rapidement entourée de Charles Gorintin et Jean-Charles Samuelian-Werve les fondateurs de la fintech Alan. Cédric O, secrétaire d'Etat chargé du la Transition numérique a ensuite rejoint l'aventure en investissant via Nopeunteo, son fonds d'investissement créé en juillet 2022.

L'équipe a par la suite eu l'opportunité de s'associer avec le fonds américain Lightspeed Venture Partners. S'en est suivi un tour de table historiqueDébut juin, Mistral AI est parvenu à lever 105 millions d'euros, auprès notamment de grands noms français, tels que Xavier Niel, JCDecaux Holding, Rodolphe Saadé ou Motier Ventures. En Europe, la Famiglia, Headline, Exor Ventures, Sofina, First Minute Capital ou encore LocalGlobe ont également participé. Pour l'occasion, Arthur Mensch, CEO de la start-up, s'était exprimé aux côtés d'Emmanuel Macron, pour évoquer la nécessité de soutenir le développement de modèles d'intelligence artificielle souverains et open source. Un véritable vacarme médiatique et depuis… plus rien. Mistral AI n'a plus communiqué sur ses ambitions, sa stratégie, ni même ses avancées, le véritable néant.

Absence quasi totale de communication

Pour en savoir plus, nous avons sollicité les fondateurs de l'entreprise. Sans succès. Persévérant, nous avons tenté notre chance auprès des salariés. Choux blanc. Aurons-nous plus de chance auprès des investisseurs ? Que nenni. "Malheureusement, je ne peux fournir aucune information", "Malheureusement pour l'instant, on ne communique pas"... Xavier Niel est l'un des rares à nous répondre autre chose, mais se limite à partager son enthousiasme : "Nous avons affaire à une équipe incroyable, qui nous a beaucoup impressionnée. Nous sommes très contents de faire partie de cette aventure". Fermez le ban. Clairement, la communication est verrouillée de l'intérieur.

Une volonté illustrée par l'extrême sobriété du site vitrine officiel de l'entreprise. Sur ce dernier, un simple message invitant les chercheurs motivés à rejoindre l'équipe : "Nous constituons une équipe de classe mondiale pour développer les meilleurs modèles d'IA génératifs. Nous opérons depuis l'Europe, avec notre siège principal à Paris. Contactez-nous si vous avez une solide expérience en tant que chercheur, ingénieur logiciel ou développeur de produits dans le domaine de l'IA". Pour le reste, passez votre chemin.

Une stratégie qui semble toutefois fonctionner. En juillet, la start-up serait parvenue à recruter plusieurs profils de haute volée. Officiellement, impossible de savoir le nombre exact de salariés en poste. La page LinkedIn affiche une masse salariale comprise entre 11 et 50 collaborateurs. Le bureau principal serait situé sur Paris, mais Mistral serait souple et offrirait un environnement de travail flexible pour ses équipes.

Est-ce une volonté stratégique de la direction pour protéger les intérêts de l'entreprise ? Est-ce une tactique de communication ? Dans les milieux open source français, beaucoup s'interrogent sur le manque de communication de Mistral. "La grande inconnue de notre côté, c'est Mistral. Je passe par différents canaux pour avoir un échange avec l'équipe fondatrice pour savoir exactement ce qu'ils veulent faire. Qu'est-ce qu'ils appellent un modèle open source ? Nous essayons de voir si on peut coopérer avec eux", s'interrogeait dans nos colonnes début juillet Michel-Marie Maudet, directeur général de Linagora et à l'initiative de la communauté OpenLLM France, qui envisage de développer un grand modèle de langage souverain et open source.

Eviter la course aux "annonces et coups marketing"

Contacté, le fond Lightspeed Venture Partners est le seul à avoir accepté de répondre dans le détail à nos question, par la voix de son associé Antoine Moyroud, en charge du dossier Mistral. Pour ce dernier, la stratégie de communication n'est pas nouvelle. " Je ne pense pas qu'il y ait de contradiction à ne pas communiquer nécessairement sur l'avancement du modèle. Anthropic et Meta sortent des modèles et ils n'avaient pas communiqué pendant la phase d'entraînement. Nous ne sommes pas dans une course aux annonces et coups marketing", justifie-t-il. Pour le moment, l'implication de la communauté open source n'aurait pas beaucoup de sens, affirme-t-il encore. "Nous considérons que pour aligner la technologie aux valeurs humaines et faire de la modération, il est plus sain de la mettre à disposition le plus largement possible, plutôt que dans la main de quelques acteurs privés", affirmait pourtant Arthur Mensch en aout dans les colonnes du Figaro.

L'ambition affichée de la start-up est "d'être compétitif sur la scène internationale et de faire en sorte que les futurs utilisateurs perçoivent une valeur différenciée par les modèles Mistral." Pour parvenir à cette étape, Mistral AI compte bien devenir un acteur européen solide et s'internationaliser ensuite. D'un point de vue éthique, l'équipe travaille assez sérieusement à prendre en compte la question fatidique de l'alignement, la capacité du modèle d'IA à refléter fidèlement les intentions et les valeurs humaines tout en évitant des comportements imprévus ou indésirables. 

Quand on interroge les chances de réussite d'un tel projet, dont le financement, bien qu'étant très compétitif en Europe, ne rivalise pas avec les acteurs américains du secteur, Antoine Moyroud répond en évoquant l'optimisation.Comme d'autres acteurs du secteur, Mistral AI a ainsi optimisé au maximum son architecture de calcul pour entraîner ses modèles. "Maintenant, nous sommes peut-être plus concentrés sur la manière d'optimiser pour obtenir une meilleure efficacité du calcul, peut-être à moindre coût, et être plus durables, tout en étant capables de créer quelque chose qui, en termes de création de valeur, peut être vendu aux entreprises", explique Antoine Moyroud.

Pour l'heure, le calendrier n'évolue pas, Mistral s'attend à communiquer à nouveau début 2024, une fois les modèles entraînés. En attendant, les fondateurs peuvent compter sur des soutiens de renom pour les driver sur la dimension politique du projet. Cédric O est particulièrement impliqué pour établir une stratégie visant à "comprendre comment interagir et interfacer avec les différents gouvernements", nous indique Antoine Moyroud. Pour sa part, Lightspeed s'occupe principalement de l'aspect business de l'entreprise, pour dégager un maximum de temps aux équipes opérationnelles. Qui n'en perdent pas non plus en paroles…