Open source : les Gafam en tête des plus gros contributeurs sur GitHub

Open source : les Gafam en tête des plus gros contributeurs sur GitHub Tous se hissent en tête du palmarès dressé par une équipe de chercheurs franco-australienne... hormis Amazon. Un indicateur présenté lors de l'Open CIO Summit 2019.

Quel est l'impact du travail rémunéré sur les projets open source ? C'est la question à laquelle tente de répondre un groupe de chercheurs franco-australiens. Organisé le 11 octobre à Paris, l'Open CIO Summit, qui fête ses dix ans, a été l'occasion pour eux de lever le voile en avant-première sur les résultats de leurs travaux.  Parmi les indicateurs mis en avant : un classement des entreprises les plus actives sur GitHub. Et là surprise, les Gafam sont presque tous présents dans le top 10 du palmarès. Dans le détail, Microsoft (qui a acquis GitHub fin 2018) se hisse en tête. Google est troisième, derrière Jetbrain. Quant à Apple et Facebook, ils trustent respectivement la cinquième et la septième position. Parmi les dix premiers acteurs de l'indice figurent en outre Red Hat / IBM (quatrième), Intel (sixième) et Pivotal (huitième).

Grand absent : Amazon. Il est vrai que le groupe de Seattle, à travers son offre cloud AWS (Amazon Web Services), a la réputation d'être un utilisateur passif de l'open source. Plusieurs éditeurs de logiciels lui reprochent d'avoir commercialisé leur propre technologie sous forme de services cloud managés sans pour autant contribuer au projet originel.  Pour protéger leurs intérêts commerciaux, certains ont donc fait le choix radical de changer de licence. C'est le cas de Confluent et Redis Labs. Le premier est passé mi-2018 d'une licence AGPL (Affero GPL) à une licence open source Apache 2.0 encadrée par des clauses limitatives, les Common Clauses. Quant à Redis Labs, il a basculé vers une nouvelle mouture de sa licence Redis Source Available Licence en février 2019.

Pour autant, Amazon se défend de profiter de la communauté open source sans rien donner en retour. "Nous contribuons à de nombreux projets open source comme Elasticsearch, Linux,  Lucene,  containerd ou encore Kubernetes, par exemple", souligne Andi Gutmans, vice-président analytics chez AWS . "Nous avons par ailleurs publié plus de 2000 projets sur GitHub parmi lesquels l'ensemble de nos kit de développement logiciel mais aussi des composants de clustering HPC, de services mesh, de serverless, de micro machine virtuelle, des protocoles réseau..." (Voir la liste des initiatives open source lancées ou soutenues par l'entreprise américaine sur son site web).

La part des contributeurs indépendants ?

Au sein des 100 membres du réseau social GitHub identifiés par les chercheurs comme les plus actifs, les contributeurs rattachés à des adresses e-mails d'entreprise sont de loin les plus nombreux (41). Les membres sans affiliation, dont les e-mails ne permettent pas de les relier à une organisation, arrivent loin derrière (avec 20 contributeurs). Fait intéressant, ces deux groupes de contributeurs ont soumis un nombre sensiblement équivalent de commits sur la période analysée (du 1er janvier 2015 au 31 mai 2019) : 1,025 million pour le premier, et 1,060 million pour le second. Ce qui pourrait tendre à prouver qu'un investissement globalement plus important est alloué du côté des entreprises comparé aux "développeurs individuels" (ou indépendants). 

Méthodologie : Ce travail de recherche s'inscrit dans le cadre du projet Digital Infrastructure initié conjointement par les Ford Foundation et Sloan Foundation. Il est mené par une équipe franco-australienne composée de cinq chercheurs : Laure Muselli de Télécom Paris - IP Paris, Stefano Zacchiroli de l'Université Paris Diderot / Inria, ainsi que Mahin Raissi, Mathieu O'Neil et Xiaolan Cai de l'Université de Canberra. Les volumes de commits utilisés pour dresser le top 20 ci-dessus ont été recueillis sur 135 repositories GitHub par le biais de l'API v3 du réseau social sur une période s'étendant du 1er janvier 2015 au 31 mai 2019.  Les repositories en question ont été sélectionnés sur la base du baromètre annuel Octoverse Report de GitHub, de l'étude Developer Survey de Stack Overflow et des repositories les plus actifs sur GitHub (voir tableau ci-dessous).

Critères de choix des 135 repositories GitHub analysés pour dresser le classement
  GitHub Octoverse Report Stack Overflow Developer Survey Repositories les plus actifs sur GitHub
Nombre de repositories GitHub sélectionnés par critère 42  45  48 
Source Section Open Source Section Technology Référentiels open source auto-identifiés
Métriques Volume de committers, commits et forks Vote des développeurs Volume de commits et d'étoiles par repositories
Intervalle de temps d'analyse Novembre 2015 à octobre 2018 Janvier 2016 à décembre 2018 Date de création du référentiel au 30 avril 2019
Nombre de commits 1 934 848 596 538 293 304