Llama 2 en open source : pourquoi ça change la donne ?
Avec la deuxième version de son modèle de langue, Meta livre pour la première fois une IA en open source qui est utilisable y compris au sein d'applications commerciales.
La bataille est relancée sur le front des large language model. Meta a annoncé ce 18 juillet la version 2 de son modèle open source Llama. Et cette deuxième version, à la différence de la première, permet de réutiliser le modèle y compris dans le cadre d'une application commerciale. Un détail qui change tout. Principale conséquence : Llama 2.0 va pouvoir être exploité immédiatement par les spécialistes des LLM pour créer des services d'IA générative de dernière génération. On pourrait ainsi voir fleurir des concurrents à ChatGPT et Google Bard reposant sur ce réseau de neurones de toute dernière génération.
A la différence des technologies d'Open AI et de Google qui s'adossent à des briques propriétaires, Llama 2.0 est donc intégralement open source. Un levier qui pourrait avoir des effets, aussi, à moyen terme. L'open source pousse le marché vers l'open innovation. Le logiciel libre distillera la technologie jusque dans les moindres PME et start-up. Il permet de récupérer un modèle puis de l'entrainer sur un data set maison pour le tester voire le mettre en production sur un cas d'usage spécifique. Sur ce plan, l'open source a déjà permis de montrer qu'il était possible de personnaliser de petits LLM avec de petits data set et, partant de-là, d'obtenir immédiatement des résultats opérationnels.
"Dans une logique open source, les données d'entrainement peuvent gagner à être plus transparentes"
De plus, "dans une logique open source, les données d'entrainement peuvent gagner à être plus transparentes. Cette transparence permet à tout contributeur d'analyser si le modèle a dérivé dans le temps et de proposer des mesures correctives", se félicite Guray Turan, directeur commercial au sein de l'éditeur logiciel Hyland. "Si les biais se manifestent dans le code de façon disparate et dans la durée, les équipes internes d'une entreprise ne sont pas nécessairement les mieux équipées pour les repérer et les éliminer. S'appuyer sur l'open source élargit considérablement le bassin de personnes travaillant sur le projet, réduisant ainsi le risque de dérapage au fur et à mesure de l'évolution de l'outil."
Mais l'initiative de Meta est loin d'être isolée. Déjà, mi-2022, Hugging Face publiait les sources de Bloom. Un modèle qui a été entrainé en France sur le supercalculateur Jean Zay du ministère de l'Enseignement supérieur, de la Recherche et de l'Innovation. De mai 2021 à mai 2022, sa conception a fédéré plus de 1 000 chercheurs issus de 60 pays. Une ressource qu'aucun Gafam n'est capable d'aligner.