Reinforcement learning, NLP, GAN : 3 concepts de l'IA à connaître

Le point sur les avancées récentes dans le secteur de l'intelligence artificielle et sur les opportunités que ces technologies représentent pour les entreprises.

Le NLP, pour aider à comprendre et exploiter des données  

Début septembre 2019, des chercheurs du Allen Institute for Artificial Intelligence, à Seattle, annonçaient que l’IA qu’ils avaient développée était capable de réussir des tests scientifiques de niveau de classes de 4e et Terminale, en répondant correctement à respectivement plus de 90% et 80% des questions. Ce programme, nommé Aristo, illustre parfaitement les progrès récents de l’IA.

Aristo s’appuie notamment sur des techniques de traitement automatique du langage naturel (NLP en anglais, pour Natural Language Processing), qui combinent des principes de linguistique, de computer science, des sciences de l’information et d’intelligence artificielle pour entraîner des ordinateurs à gérer et analyser de très grands corpus de texte.

Ces dernières années ont vu émerger des modèles de plus en plus complexes, capables d’exploiter de vastes volumes de données, mais aussi de simuler, de façon encore rudimentaire, des modes de raisonnement. Le but, pour le moment, est de permettre à ces programmes de comprendre les éléments qui leur sont présentés, pour les rendre ensuite intelligibles pour des humains.

De telles technologies pourraient avoir des implications majeures dans la santé, un domaine dans lequel le volume de données disponibles double tous les 73 jours. En particulier, les médecins et professionnels de santé peuvent recourir au NLP pour collecter, analyser et résumer les informations dont ils disposent. Une étude menée par le Dana-Farber Cancer Institute s’est ainsi appuyée sur des modèles de NLP pour analyser plus de 14 000 dossiers médicaux : l’outil a permis de faire remonter des éléments pertinents pour les médecins, aussi efficacement qu’un humain, mais plus rapidement et à moindre coût.

Dans le futur, de tels outils pourraient accélérer tous types de travaux de recherche, dans des domaines comme la gestion d’actifs financiers, le développement de produits ou la sécurité alimentaire, pour ne citer que quelques exemples.

Les GANs et autres modèles génératifs profonds, pour accélérer la phase de conception

Alors que les modèles de machine learning sont généralement utilisés pour identifier des motifs récurrents et des corrélations dans un lot de données (par exemple dans un corpus de textes ou d’images, des données transactionnelles...), les modèles génératifs profonds ont un but inverse, celui de générer de nouvelles données réalistes.

En particulier, les réseaux antagonistes génératifs (GANs en anglais, pour Generative Adversarial Networks) mettent deux modèles de réseaux de neurones profonds en concurrence (d’où l’adjectif “antagonistes”). Un premier modèle (le générateur) crée un contenu - une image, de la musique, un discours, etc. - puis un second modèle (le discriminant) est chargé de déterminer si ce contenu est aussi réaliste qu’un contenu du même type considéré comme valide (par exemple, une photo prise par un appareil photo ou une phrase écrite par un humain).

Les différentes itérations du premier modèle sont testées par le discriminant, qui effectue la validation. Le but du générateur est donc de duper son vérificateur, pour produire des contenus qui ne peuvent plus être distingués des “vrais”.

Insilico Medicine a utilisé une approche de type GAN pour réduire drastiquement sa phase de R&D lors de la conception d’un nouveau médicament : celle-ci s’est limitée à 46 jours, alors qu’elle est habituellement de 2 à 3 ans… Pour cela, le modèle a généré des milliers de composants potentiels jusqu’à aboutir à une molécule spécifique, qui a ensuite fait l’objet d’essais cliniques. Dans un autre domaine, Autodesk, un équipementier pour les industries aéronautique et automobile, utilise déjà les GANs pour concevoir de nouvelles pièces. En partenariat avec Airbus, ses équipes ont ainsi développé une cloison plus solide que les versions précédentes, mais moitié moins lourde.

Le recours à de tels modèles permet donc d’accélérer les démarches de R&D, mais aussi de réduire les coûts.

Le (Deep) Reinforcement Learning, pour faciliter la prise de décision

L’apprentissage par renforcement (Reinforcement Learning en anglais) est un autre domaine qui profite des avancées récentes des réseaux de neurones profonds. Un agent - par exemple un robot, ou un bot dans un jeu - interagit avec son environnement à travers les actions qu’il accomplit et les observations et récompenses qu’il reçoit en retour. Cet agent apprend par essais successifs jusqu’à atteindre un objectif précis, guidé par la récompense qu’il accumule - par exemple le score dans un jeu.

Les modèles d’apprentissage par renforcement profond (DRL pour Deep Reinforcement Learning) intègrent en plus du Deep Learning, pour, par exemple, encoder la représentation par l’agent de son environnement. Ils ont été développés et popularisés par Google DeepMind dans le domaine du jeu : AlphaGo et AlphaStar sont basés sur des modèles de DRL.

Pour autant, l’intérêt du Deep Reinforcement Learning ne se limite pas au jeu : en tant que technique d’optimisation des prises de décision, il a aussi des applications en entreprise ou pour les collectivités. À l’échelle d’une ville, il peut par exemple servir à déterminer les meilleures configurations pour les feux de signalisation. Dans les data centers, les ressources peuvent aussi être optimisées de la sorte. D’ailleurs, déployer un programme similaire à celui d’AlphaGo dans ses centres a permis à Google de réduire le coût du refroidissement des serveurs de 40%.

Ces différents exemples le montrent : l’IA a dépassé le stade de la théorie. Les entreprises peuvent désormais prendre en main ces outils et implémenter les modèles d'intelligence artificielle dans leurs organisations et processus de décisions.

Propos recueillis par Nova Halliwell