L'informatique neuromorphique peut-elle alléger l'empreinte carbone de l'IA ?
Notre cerveau est l'ordinateur le plus efficace qui soit : il consomme environ 20 watts d'énergie, une broutille par rapport aux millions de Watts consommés par les supercalculateurs. Cette remarquable efficacité énergétique, des chercheurs souhaitent s'en inspirer pour concevoir des puces informatiques économes, qui permettent de tirer les bénéfices de l'IA sans faire exploser la facture énergétique et environnementale.
Le fait que l'informatique s'inspire de notre cerveau n'a en soi rien de nouveau : les réseaux de neurones, qui ont permis les récents progrès de l'IA, imitent eux aussi le fonctionnement du cerveau humain. Mais l'informatique neuromorphique souhaite aller un cran plus loin. En effet, sur les semi-conducteurs traditionnels, utilisés aujourd'hui pour faire tourner les algorithmes d'IA, le processeur qui réalise les calculs et la mémoire qui stocke les résultats sont physiquement séparés, ce qui génère de l'inefficacité. Transférer les données de l'un à l'autre consomme en effet du temps et de l'énergie. Un phénomène baptisé le goulot d'étranglement de von Neumann, qui fait que la multiplication de la puissance informatique, liée à la loi empirique de Moore, s'accompagne d'une voracité énergétique toujours plus grande.
En proposant de nouvelles puces qui s'affranchissent de cette dichotomie entre calculs et mémoire, l'informatique neuromorphique entend permettre un traitement de l'information plus efficace et une consommation énergétique largement réduite (jusqu'à mille fois moins qu'une puce classique).
Elle s'appuie à cet effet sur les propriétés de la spintronique, une branche de la physique et de l'électronique qui exploite non seulement la charge électrique des électrons (comme l'électronique classique), mais aussi leur spin, c'est-à-dire la rotation de l'électron sur lui-même.
La discipline relève de la recherche fondamentale et est explorée depuis plusieurs années. Elle est aujourd'hui en passe d'arriver à maturité, avec des jeunes pousses qui proposent de premiers produits. De quoi répondre aux enjeux majeurs en matière de dépenses énergétiques causés par les grands modèles de langage.
L'informatique neuromorphique commence à être commercialisée
Dans un papier de recherche paru dans Nature en janvier, plusieurs chercheurs spécialisés dans l'informatique neuromorphique affirment ainsi que leur discipline est mûre pour s'émanciper du domaine académique et fournir des produits viables sur le marché. "Nous sommes très proches d'avoir des systèmes neuromorphiques à l'échelle, capables de soutenir de grands modèles de langages", déclarait ainsi Steve Furber, l'un des coauteurs de l'étude, lors d'une interview accordée au moment de la parution de celle-ci. "Nous avons simplement besoin d'une démonstration sous la forme d'une "killer app"."
L'an passé, l'entreprise américaine Intel a construit le plus grand écosystème neuromorphique au monde, connu sous le nom de code Hala Point. Selon Intel, il s'agit du premier système neuromorphique à grande échelle qui surpasse l'efficacité et les performances des architectures basées sur le CPU et le GPU pour les charges de travail d'IA en temps réel.
La société israélienne Hailo AI a de son côté présenté ses puces neuromorphiques dédiées à l'IA générative et à l'automobile lors de la dernière édition du CES.
Côté français, un écosystème dynamique est également en train de se mettre en place, porté par l'excellence de quelques laboratoires de recherche fondamentale, dont le CNRS et le CEA-Leti. L'un des pères de la spintronique, Albert Fert, prix Nobel de physique 2007, est d'ailleurs français.
Parmi les jeunes pousses hexagonales, citons notamment Golana Computing, issue du laboratoire Spintec, à Grenoble, ou encore Spin Ion, jeune pousse issue du CNRS. Toutes deux proposent des puces neuromorphiques taillées pour l'informatique en périphérie, ou edge computing. En effet, le gain considérable en matière d'efficacité et de dépenses énergétiques permet de réaliser des opérations plus complexes sur de petits appareils, facilitant le déploiement de l'IA sur les smartphones et objets connectés.
Des systèmes autoapprenants au service d'une plus grande confidentialité
Mais ce n'est pas tout. Par rapport aux puces classiques, les puces neuromorphiques permettent de déployer plus facilement des systèmes d'IA qui continuent d'apprendre en temps réel, sur le modèle du cerveau humain. L'idée est d'entraîner un modèle par des moyens traditionnels, puis de le charger dans la puce neuromorphique. Le modèle peut alors s'entraîner dans son environnement et continuer à apprendre de nouvelles tâches. Il n'est ainsi pas nécessaire de repasser par le cloud pour réentraîner complètement la puce avec les nouvelles données, celle-ci est capable de continuer à apprendre de manière autonome.
Traditionnellement, une voiture autonome se remet à jour régulièrement en retransférant ses nouvelles données vers le cloud (concernant par exemple un obstacle qu'elle n'avait jamais vu auparavant). Le modèle est ensuite réentraîné et réinjecté dans la voiture autonome. Avec une puce neuromorphique, il pourrait se réentrainer tout seul, dans la voiture, sans nécessiter de transfert de données. Même chose pour un appareil médical connecté, par exemple, ou encore pour des robots industriels.
Mercedes-Benz a récemment lancé un projet de recherche avec une université canadienne dans cette optique. "L'informatique neuromorphique peut réduire de 90% l'énergie nécessaire pour traiter les données de conduite autonome, par rapport aux systèmes actuels", affirme l'entreprise. "Les systèmes de sécurité pourraient, par exemple, reconnaître les panneaux de signalisation, les files et les autres routes plus vites et plus efficacement."
Outre l'économie énergétique que l'on réalise en limitant les transferts de données, ce système présente des avantages considérables en matière de protection de la vie privée : en effet, moins de transferts de données signifie moins de fuites potentielles, mais d'opportunités d'attaques pour les hackers, mais aussi une meilleure protection face aux lois extraterritoriales américaines comme le Cloud Act, qui permet aux autorités américaines d'accéder aux données stockées sur un cloud américain même si elles sont hébergées sur des serveurs situés à l'étranger.
L'adoption de cette technologie se heurte cependant à plusieurs freins. En particulier, elle implique de nouveaux langages de programmation et architectures informatiques qui ne sont pas compatibles avec les technologies existantes. Elle requiert donc l'émergence d'un nouvel écosystème de développeurs et de logiciels susceptibles de coder et proposer des applications neuromorphiques.