L'IA de demain : comment les Small et Medium Language Models répondent aux enjeux de performance et d'écologie ?
Les modèles d'Intelligence Artificielle générative ont transformé notre rapport au numérique, mais à quel prix ?
Les modèles d’Intelligence Artificielle générative ont transformé notre rapport au numérique, mais à quel prix ? Alors que les entreprises cherchent à exploiter tout leur potentiel, plusieurs défis majeurs émergent : consommation énergétique croissante, infrastructures coûteuses et fiabilité des réponses. L’impact environnemental de ces technologies devient une préoccupation centrale, d’autant plus que la consommation énergétique de l’IA pourrait être multipliée par 4 à 9 d’ici 2050.
Face à ces enjeux, une nouvelle génération de modèles émerge : les Small Language Models (SLMs) et Medium Language Models (MLMs). Plus compacts, plus spécialisés et moins énergivores, ils offrent une alternative plus efficiente et durable, mieux adaptée aux besoins spécifiques des entreprises et des particuliers.
Des modèles plus petits, un impact plus grand : l'efficacité des SLMs et MLMs
Les Small et Medium Language Models (SLMs et MLMs) se distinguent par leur capacité à répondre de manière ciblée aux besoins des utilisateurs, tout en restant bien plus légers que les grands modèles. Contrairement aux LLMs, qui nécessitent des infrastructures massives pour l’entraînement et l’exploitation, ils sont conçus pour être plus légers tout en maintenant des performances élevées. Un SLM compte moins de 30 milliards de paramètres, comme Phi-3 de Microsoft, qui en possède 3,8 milliards. À l’opposé, un LLM tel que GPT-4o repose sur une architecture bien plus massive, avec 1,8 trillion de paramètres. Grâce à leur conception optimisée, les SLMs et MLMs permettent de réaliser des missions complexes, comme la génération de texte ou l’analyse sémantique, avec des ressources nettement réduites.
Cette taille réduite permet aussi une personnalisation accrue, offrant ainsi aux entreprises la possibilité d’adapter les modèles à leurs besoins précis. Par exemple, Meditron, développé par Meta, assiste les professionnels de santé dans la prise de décisions cliniques. Florence2 se spécialise dans la reconnaissance d'images, tandis que Spreadsheet est conçu pour le traitement des données dans des tableurs. Ces modèles spécialisés sont non seulement mieux adaptés aux besoins des entreprises, mais aussi plus accessibles, permettant de tirer parti de l’IA sans nécessiter des investissements massifs dans des infrastructures coûteuses.
De plus, les SLMs et MLMs bénéficient d’une flexibilité accrue grâce aux modèles multimodaux, capables de traiter simultanément texte, images et sons. Cela ouvre la voie à des applications plus riches. Par exemple, dans l’analyse d’images médicales, ces modèles peuvent non seulement traiter les visuels, mais aussi générer des descriptions textuelles pour fournir un diagnostic plus complet. Des applications comme GPT-4o, qui intègrent des capacités audio, permettent de développer des solutions innovantes pour des domaines tels que la sécurité ou l’assistance vocale avancée.
L'empreinte écologique de l'IA : vers des modèles plus durables
L’une des grandes promesses des Small et Medium Language Models est leur capacité à répondre aux préoccupations environnementales liées à l'IA. Les LLMs, en raison de leur taille et de leur besoin constant en calculs puissants, ont une empreinte écologique significative. Leur entraînement nécessite non seulement des serveurs massifs mais aussi une consommation d’énergie colossale. Par exemple, l’entraînement de modèles de grande envergure comme GPT-3 nécessite environ 1 287 mégawattheures (MWh) d’électricité, soit l'équivalent de la consommation annuelle de 120 foyers américains. Selon les prévisions, la demande mondiale en IA pourrait entraîner un prélèvement de 4,2 à 6,6 milliards de mètres cubes d’eau d’ici 2027, une quantité équivalente à 4 à 6 fois la consommation annuelle du Danemark.
En adoptant des modèles plus petits, les entreprises peuvent non seulement réduire leurs coûts, mais aussi diminuer leur impact sur l'environnement. Par exemple, des entreprises qui choisissent d’utiliser des modèles plus spécialisés pour des tâches précises peuvent minimiser l’utilisation de serveurs et donc l'énergie nécessaire à leur fonctionnement. Un SLM peut fonctionner sur un ordinateur local, sans connexion Internet, à condition de disposer d’une puce GPU (Graphics Processing Unit). Par exemple, Phi-3 de Microsoft peut tourner sur un MacBook M3, alors qu’un modèle plus massif comme GPT nécessite des centaines de GPU pour fonctionner. Cette approche contribue à une utilisation plus responsable des ressources informatiques et s'inscrit dans une tendance générale à la durabilité dans le secteur technologique.
Les tendances à suivre en 2025 : entre promesses et défis
L’intelligence artificielle entre dans une phase de maturation où l’efficacité et la spécialisation priment sur la course à des modèles toujours plus vastes. Grâce aux modèles spécialisés, compacts et multimodaux, l’IA devient plus accessible, performante et adaptable, répondant aux enjeux de personnalisation, de durabilité et d’optimisation pour les entreprises.
Cependant, son adoption reste freinée par des contraintes humaines, techniques, écologiques et légales. Malgré des avancées notables dans la compréhension et le traitement du contexte, l’IA reste limitée par la qualité des données sur lesquelles elle est entraînée. Des jeux de données biaisés, incomplets ou obsolètes peuvent entraîner des erreurs et altérer sa fiabilité. Par ailleurs, plus un contexte est complexe ou nécessite des connaissances spécialisées, plus il devient difficile pour l’IA de fournir des réponses précises. De plus, elle peine encore à interpréter certaines subtilités comme l’humour, l’ironie ou les références culturelles spécifiques.
À ce jour, les modèles existants ne permettent pas encore une transition vers une intelligence artificielle générale. Il est donc essentiel d’avancer avec prudence et discernement. L’IA doit être considérée comme un outil d’assistance et d’optimisation, plutôt que comme un substitut à l’intelligence humaine. L’avenir de l’IA réside dans une collaboration équilibrée entre l’humain et la technologie, où les outils intelligents et ergonomiques, adaptés aux besoins des utilisateurs, deviendront des leviers puissants pour accompagner l’innovation et la performance des entreprises.
1- Source : étude Deloitte, octobre 2024 2- Source : Sciences et Avenir n°935, daté janvier 2025. 3- Source : Making AI Less « Thirsty »: Uncovering and Addressing the Secret Water Footprint of AI Models, 29 10 2023