Dans l'IA, la guerre des Gafa se fait à grands coups d'open source

Depuis quelques mois, les géants du numérique ont versé à la communauté un grand nombre de moteurs d'apprentissage profond et autres outils d'intelligence cognitive.

Entre Google, Facebook ou Amazon, c'est à celui qui versera le plus possible d'outils d'intelligence artificielle en open source. Qu'ont à gagner ces entreprises à rendre accessibles et gratuites des briques aussi sensibles ? Il s'agit tout d'abord de marquer les esprits. Dans ce domaine où il y a encore tout à découvrir, la prime au pionner n'est pas une vaine expression. Avec l'open source, ces géants du web s'assurent que leurs outils seront massivement adoptés en espérant qu'ils deviennent des standards de fait. Donner à des experts et chercheurs en IA la possibilité de contribuer au code doit également permettre de perfectionner la technologie et, in fine, les solutions commerciales. Cerise sur le gâteau, la démarche facilite mécaniquement le recrutement de talents issus du monde open source, des développeurs qui se distinguent par leur activisme. Bref, l'open source constitue un marchepied pour imposer son leadership dans un domaine en pleine ébullition.

Google envoie un signal fort

A ce jeu, Google fait la course en tête. Dès novembre 2015, la firme de Mountain View plaçait TensorFlow sous licence Apache 2.0. Un fait notable puisqu'il s'agit là d'une brique maîtresse de sa stratégie d'intelligence artificielle. Moteur d'apprentissage profond, TensorFlow permet de construire et entraîner des réseaux neuronaux. Google l'utilise pour ses propres besoins, notamment en matière de reconnaissance vocale. En février dernier, le groupe américain publiait la version finale 1.0 du framework de deep learning.

TensorFlow de Google, désormais infrastructure star de deep learning

Mais TensorFlow, qui s'est depuis imposé parmi les infrastructures stars de deep learning, ne doit pas occulter les autres outils "libérés" par Google. Sur son portail opensource.google.com, ouvert en mars dernier, on en retrouve une vingtaine. C'est le cas de SyntaxNet, un outil d'analyse sémantique pour aider les machines à saisir les subtilités du langage humain, ou encore de Magenta, un projet d'intelligence artificielle qui se propose de créer de la musique avec une créativité proche de celle de l'homme. Sous-programme de TensorFlow, Embedding Projector est, lui, un outil de visualisation des données.

L'offensive de Google ne s'arrête pas là. En décembre 2016, le groupe rendait publique la plateforme utilisée par sa filiale DeepMind pour les jeux de labyrinthe. Appelée fort justement Labyrinth puis DeepMind Lab, elle permet de concevoir des environnements 3D à destination des agents intelligents, notamment pour les jeux vidéos. Début juillet 2017, l'Américain lançait par ailleurs le projet PAIR (pour "the People + AI Research initiative") qui vise à replacer l'homme au cœur des recherches sur l'intelligence artificielle, en rendant notamment les technologies d'IA accessibles au plus grand nombre. Dans la foulée, Google plaçait en open source deux outils de data visualisation taillés pour fournir une vision des jeux de données utilisés pour entraîner les modèles d'auto-apprentissage : Facets Overview et Facets Dive.

Le FAIR de Facebook face au PAIR de Google

Facebook colle à la culotte de Google. Bien avant le PAIR de Google, le réseau social avait créé, en 2013, FAIR, pour Facebook artificial intelligence research. Au fil des années, ce laboratoire de recherche en intelligence artificielle a mis une dizaine d'outils en open source. Dans le lot, on relève deux frameworks de développement, Torch et Caffe2. Mais également ParlAI, une plateforme pour former des modèles sur une grande variété de jeux de données. Ou encore fastText, une bibliothèque de classification de textes. Dirigé par le français Yann Le Cun, FAIR dispose d'une antenne à Paris.

Dans le sillage de Google et Facebook, Microsoft se positionne également sur ce terrain de l'IA open source. En janvier 2016, la firme de Redmond plaçait CNTK (pour Computational network toolkit) sous licence MIT. Boîte à outils d'intelligence artificielle, CNTK est utilisée par l'éditeur pour ses propres besoins, qu'il s'agisse de la recherche de vidéos pour son moteur Bing, la reconnaissance de la parole pour son assistant Cortana ou encore la traduction automatique pour Skype. Rebaptisée Cognitive Toolkit, cette suite logicielle est sortie en version 2.0 en juin dernier.

Alliance entre Microsoft et Amazon Web Services

Un peu moins actif dans la bataille, Amazon n'en demeure pas moins bien présent. En mai 2016, le géant du e-commerce mettait gratuitement à disposition du public l'une de ses technologies d'IA phare. Elle porte sur le cœur de son métier. A savoir : la recommandation de produits personnalisée. Publiée sur GitHub, cette brique, baptisée DSSTNE (pour Deep Scalable Sparse Tensor Network Engine), est conçue pour entraîner des réseaux neuronaux de deep Learning à grande échelle. La filiale cloud du groupe américain, Amazon Web Services (AWS) a aussi versé, en janvier dernier, à la communauté Apache, MXNet : un framework d'apprentissage profond sous Linux et Ubuntu.

Apple, membre de Partnership on AI

Enfin, il ne faudrait pas oublier leur aîné à tous : IBM. Big Blue partageait, dès novembre 2015, son logiciel propriétaire SystemML sous licence Apache. SystemML est conçu pour automatiser la conception d'algorithmes d'apprentissage statistique.

Reste que cette compétition entre géants du numérique n'a pas empêché la signature d'alliances de circonstance. Mi-octobre, les frères ennemis du cloud public, AWS et Microsoft, lançaient Gluon, une bibliothèque de deep learning (disponible sur GitHub). Son interface intuitive doit faciliter la conception de modèles, du prototypage au déploiement. Gluon fonctionne avec MXNet d'AWS, et devrait prochainement supporter le Cognitive Toolkit de Microsoft.

En décembre dernier, Amazon, Facebook, Google, IBM et Microsoft, rejoints pour l'occasion par Apple, créaient la Partnership on AI (ou Partnership on AI to benefit people and society) : une organisation qui vise à promouvoir l'intelligence artificielle et à définir un cadre de bonnes pratiques en matière d'éthique ou d'interopérabilité. L'initiative rappelle celle de l'OpenAI. Présidée par Elon Musk et Sam Altman (Y Combinator), cette association à but non lucratif vise également à s'assurer que les progrès de l'IA profitent bien à la société, en s'appuyant là encore sur une logique d'open innovation.