L'IA multi-agents, une approche pleine de promesses

L'IA multi-agents, une approche pleine de promesses Découper l'IA en sous-tâches, chacune prise en charge par un modèle dans une logique collaborative, permet de résoudre des problèmes complexes.

Ces dernières années, une approche particulièrement prometteuse a émergé dans l'intelligence artificielle au travers des systèmes multi-agents. Contrairement aux IA classiques basées sur des modèles centralisés, cette approche repose sur des entités autonomes et interactives appelées "agents" renvoyant chacune à des modèles de machine learning, voire d'autres types d'application. Chaque agent possède ses propres objectifs, perceptions et capacités d'action et opère dans son environnement. Les agents peuvent aussi communiquer et interagir entre eux, donnant naissance à une forme d'intelligence artificielles collective.

"L'approche multi-agents est une alternative à l'utilisation des grands modèles centralisés qui, certes, sont polyvalents, mais restent onéreux à l'usage du fait de leur taille et de leur approche le plus souvent propriétaire", souligne Martin Alteirac, AI lead chez Saegus. D'où l'idée de découper une tâche d'IA complexe en un ensemble de sous-tâches élémentaires, chacune prise en charge par un modèle spécifique moins puissant et donc peu cher à entraîner.

De nombreux cas d'usage

Les IA orientées agents présentent de nombreux avantages. Tout d'abord, elles sont modulaires et distribuées. "On découpe un processus complexe en petites tâches, ce qui permet de mieux contrôler l'ensemble, voire de faire évoluer chacune des tâches indépendamment les unes des autres dans une logique de micro-services", explique Martin Alteirac. "Dans le même temps, on répartit les risques sur plusieurs fournisseurs de modèles. Ce qui évite de mettre tous ses œufs dans le même panier en prenant le risque que l'éditeur retenu fasse évoluer son pricing ou ne supporte plus son modèle."

Une couche applicative d'orchestration, basée typiquement sur la technologie open source LangChain, va gérer l'intervention des agents. Partant de là, on pourra tester de nouveaux modèles à la volée pour éprouver leur performance sur une tâche donnée en les comparant aux modèles utilisés jusqu'alors. Cette modularité permet également de distribuer facilement le traitement sur plusieurs machines. Les IA orientées agents se montrent également plus flexibles et dynamiques que les approches centralisées. Les agents peuvent s'adapter à des environnements changeants et imprévisibles, et modifier leur comportement en temps réel en fonction des actions des autres agents. Cette flexibilité permet de résoudre des problèmes difficilement appréhendables par des algorithmes figés.

Du côté des équipes de Saegus, on travaille notamment pour un acteur de la fonction publique en vue de mettre en place un système d'IA multi-agents pour gérer des processus. En amont, un modèle de type OCR (pour optical character recognition) est conçu pour extraire du texte au sein de documents réceptionnés par l'administration. Un deuxième modèle déniche des entités telles qu'un nom, une adresse ou un numéro de sécurité social. Un troisième réalise des résumés, etc. "En aval, des modèles de langue vont venir vérifier la conformité de ce qui a été extrait, en analysant les chaînes de caractères par exemple", décrypte Martin Alteirac.

Des applications dans la sécurité

Editeur français de solutions de protection des e-mails, Mailinblack s'adosse à une solution d'IA multi-agents pour orchestrer la détection des liens de hameçonnage au sein des messages qu'il passe au crible. "Nous recourons à une série de classificateurs. Les uns venant combler les angles morts des autres", résume Achraf Hamid, data team lead chez Mailinblack. En amont, un réseau de neurones convolutif détecte les suites de caractères non-linéaires des URL. Ensuite, un modèle (type XGBoost), combinant de nombreux arbres de décision répartis en plusieurs forêts aléatoires, étudie plus de 200 caractéristiques : longueurs et structures des liens, types de caractères... "Au final, on se retrouve avec une quarantaine de groupes d'URL avec chacun leurs spécificités." Enfin, un classificateur SVM (pour support-vector machine) vient améliorer la prédiction. "Il projette dans un espace multidimensionnel toutes les caractéristiques issues des URL. Il estime ensuite l'hyperplan qui permet de séparer au mieux les différents groupes", ajoute Achraf Hamid.

"On peut recourir à des modèles open source de taille moyenne qui mis bout ou bout sur des tâches simples permettent d'aboutir au même résultat qu'avec GPT-4 ou Gemini Pro"

Pour optimiser le tout, les agents de Mailinblack collaborent entre eux. "Les agents ayant des performances historiques plus élevées au regard des URLs analysées se voient attribuer des poids plus importants", poursuit Achraf Hamid. "La décision finale est basée sur la somme pondérée des prédictions de tous les agents participants. Si cette somme dépasse un seuil prédéfini, le lien est classé comme malveillant." Pour s'adapter à l'évolution permanente de l'ingénierie des pirates, le système est continuellement évalué sur de nouvelles données en se basant notamment sur les bases publiques d'URL de phishing.  "Ces retours sont utilisés pour mettre à jour les modèles, ajuster les poids et améliorer les performances globales du système. Cela permet de gérer efficacement l'émergence de nouvelles formes d'attaque", conclut Achraf Hamid. Grâce à cette technique, Mailinblack revendique détecter 79,9% des liens de phishing nouvellement créés.

Aux côtés des processus administratifs et de la cybersécurité, les IA multi-agents peuvent être actionnées dans une grande variété de domaines. On les retrouve notamment dans des applications de simulation touchant par exemple à la modélisation du trafic routier, ou encore dans l'analyse des marchés financiers pour détecter des opportunités d'arbitrage ou automatiser les négociations. Leur capacité à faire émerger des comportements macroscopiques à partir de simples règles fait de cette méthode un outil puissant pour comprendre, prédire et optimiser le fonctionnement de ces environnements. Dans le domaine du transport et de la logistique, elles servent également à coordonner des flottes de véhicules autonomes ou des chaînes d'approvisionnement complexes impliquant de nombreux acteurs. On les retrouve aussi dans la coordination d'équipes de robots, par exemple dans les entrepôts automatisés.

Small is beautiful

Parmi ses principaux avantages, l'IA multi-agents permet potentiellement d'aboutir à une performance équivalente à celle des modèles centralisés, voire dans certains cas meilleure que ces derniers. Globalement, cette approche permet au total de réaliser des actions in fine complexe qu'un gros modèle ne serait pas forcément capable d'adresser de manière aussi performante.

"On peut recourir à des modèles open source de taille moyenne comme ceux de Mistral ou de Meta (avec Llama, ndlr), qui certes sont moins généralistes et apparaissent dans les classements comme moins performants, mais qui mis bout ou bout sur des tâches simples permettront d'aboutir au même résultat qu'avec GPT-4 ou Gemini Pro", poursuit Martin Alteirac chez Saegus. "Une approche qui, même si elle implique d'acquérir une infrastructure de calcul, se révèlera moins chère qu'une solution cloud clé en main souscrite chez un provider qui appliquera sa marge au passage."