Google, Facebook, Microsoft... Quel Gafam remporte la palme de l'IA open source ?
Tour d'horizon des projets open source les plus actifs sur GitHub lancés dans l'intelligence artificielle par les Gafam.
Sur le terrain du machine learning, les Gafam sont tous engagés dans des stratégies open source. En offrant des bibliothèques d'algorithmes et autres briques d'intelligence artificielle sous licences "ouvertes", ils font la démonstration de leur dynamisme en matière d'IA, notamment vis-à-vis du monde scientifique et des professionnels de la data. Par la même occasion, ils se donnent la possibilité d'ouvrir la porte à des contributions externes dans une logique de mutualisation en matière de recherche et développements.
A ce jeu-là, Google sort grand favori. Le groupe de Mountain View arrive de loin en tête du classement JDN des projets d'IA open source les plus actifs sur GitHub avec sa librairie de deep learning TensorFlow. La technologie concurrente de Facebook, Pytorch, se hisse à quelques encablures derrière. Les deux acteurs sont aussi ceux qui reviennent le plus souvent dans notre Top 20. Facebook y est présent à huit reprises, et Google à six.
En fonction des acteurs, les motivations en faveur d'une IA ouverte diffèrent. Pour Google et Microsoft, l'objectif est avant tout de conduire un maximum d'organisations à se tourner vers leurs services commerciaux d'IA en mode cloud. Quitte d'ailleurs à voir leurs briques open source être implémentées par la concurrence à l'image de Tensorflow. Disponible depuis fin 2015 sous licence Apache 2.0, la bibliothèque d'apprentissage profond de Google s'est depuis imposée comme un standard. Compte tenu de l'engouement qu'elle suscite, Amazon comme Microsoft n'ont eu d'autre choix que de l'intégrer à leur cloud respectif. Fait intéressant, 85% des traitements TensorFlow sont désormais exécutés sur la plateforme SageMaker d'Amazon, selon NucleusResearch.
"IA appliquée vs IA fondamentale"
Chez Facebook, la stratégie d'IA open source n'est, à contrario, pas directement orientée client. Dirigé par le français Yann Lecun, le réseau mondial de laboratoires de recherche en intelligence artificielle du réseau social (Fair) est à l'origine de multiples projets open source. Aux côtés des huit relayés dans notre classement, nous en avons dénombré une quinzaine en forte activité. En partageant ses codes, Fair entend avant tout contribuer à l'émulation de la communauté scientifique. Communiquer ainsi sur ses travaux en IA est également un moyen pour Facebook d'attirer de nouvelles têtes pensantes au sein de sa R&D. Même finalité pour Deepmind, la filiale de recherche en technologies cognitives de Google (issue d'un rachat bouclé en 2014), qui, elle aussi, multiplie les chantiers d'applications open.
Microsoft pointe à la quatrième position du palmarès avec son framework ML.Net taillé pour sa plateforme .Net. Quant à son Cognitive Toolkit, il truste la sixième place du classement. Historiquement moins engagés dans l'open source, Amazon (via sa filiale cloud AWS) et Apple affichent chacun un projet unique au sein de l'indice.
Méthodologie : une centaine de projets open source ont été identifiés et analysés pour dresser ce palmarès. Les 61 les plus actifs au 9 janvier 2020 en termes de communication et de développement (avec des commits sur les 6-9 derniers mois) ont été retenus. Dans le détail, ont été sélectionnés sur cette base 28 projets pour Google, 20 pour Facebook, 8 pour Microsoft, 3 pour Amazon et 2 pour Apple.
Calculé sur un base 1000, qui correspond au numéro 1 du classement, en l’occurrence TensorFlow, l'indice tient compte du nombre de commits, d'étoiles et de forks de chaque projet, chaque critère ayant le même poids pour constituer la note finale.
Le projet SyntaxNet de Google n'a pas pu être pris en compte, l'historique de ses commits n'étant pas communiquée. Il affiche cependant 60 900 étoiles et 38 700 forks. En prenant en compte ces deux seuls indicateurs, il se placerait juste derrière TensorFlow.