+39% de productivité : comment (vraiment) bien utiliser les agents de code

Une étude menée par l'Université de Chicago démontre comment les agents de code dégagent un vrai gain de productivité au sein des organisations qui les adoptent.

Les agents IA tiennent-ils réellement leur promesse de productivité ? Jusqu’ici, le marché restait prudent. Mais une nouvelle étude menée par Suproteem Sarkar, un chercheur de l’université de Chicago, apporte les premières preuves chiffrées à grande échelle. Dans les organisations ayant adopté des agents de code, la production logicielle progresse en moyenne de 39%. Une accélération nette, dont l’ampleur varie selon les tâches confiées.

L'étude de l’université de Chicago repose sur l'analyse d’entreprises utilisatrices de l’agent de code de Cursor. Le chercheur a examiné les données de fusion de code (merges) sur la période d'octobre 2024 à mai 2025, en comparant 24 entreprises déjà actives avant le lancement de l'agent avec 8 organisations témoins n'ayant pas utilisé la plateforme durant cette période.

Les résultats sont sans ambiguïté : l’introduction de l’agent augmente immédiatement de 26% le nombre de merges hebdomadaires, puis cet effet grimpe à 39% lorsque l’agent devient le mode de génération par défaut. Autrement dit, plus les équipes intègrent l’agent dans leur routine, plus l’accélération de la production logicielle est forte. Plus intéressant encore, les entreprises n’ont pas vu une évolution de leur taux de reverts (suppression du merge, souvent causée par un code médiocre ou avec des bugs). Concrètement, la hausse de la productivité ne s’accompagne pas, comme on aurait pu le penser, d’une baisse de la qualité du code généré.

Le nombre de merges augmente clairement avec l’arrivée de Cursor. © Capture d’écran / JDN

Les 4 domaines où les agents de code excellent

Les implémentations rapides de fonctionnalités

Les agents excellent dès que le retour sur exécution est immédiat : prototypes rapides, corrections mineures, ajustements localisés. Selon les données de l’étude, ces tâches représentent une large part des interactions enregistrées dans Cursor, avec une proportion élevée de requêtes orientées “implémentation directe”. Leur point commun est la possibilité de vérifier instantanément le résultat : l’agent génère le code, l’utilisateur teste, puis ajuste si nécessaire. L’analyse montre, par ailleurs, que les modifications issues de ces tâches courtes affichent un taux d’acceptation élevé.

Les tâches de planification

Au-delà de l’implémentation directe, l’étude relève un usage récurrent : la demande de “plan”. Les utilisateurs expérimentés ont tendance à solliciter l’agent pour obtenir une proposition d’étapes, un ordre logique de modifications ou des options d’implémentation. L’agent va alors réfléchir aux différentes possibilités et proposer plusieurs solutions adaptées au contexte. Or les données de l’étude montrent qu’un workflow en deux temps planification puis génération de code améliore sensiblement le taux d’acceptation des modifications.

Les explications de code et de bugs

Près de 25% des interactions avec Cursor relèvent de l’explication de code ou de l’analyse d’erreurs. Les agents y démontrent une capacité efficace à synthétiser la logique d’un fichier, à interpréter un comportement inattendu ou à analyser une stacktrace. Plus précisément, 12,1% des messages demandent des explications sur le fonctionnement d'une base de code existante, tandis que 11,9% concernent directement la résolution de bugs à partir des logs. Le gain de productivité y est élevé parce que ces tâches sont normalement très consommatrices de temps : il faut fouiller le code, ouvrir plusieurs fichiers, comprendre la logique. Les agents, eux, analysent le contexte global et comprennent très bien les actions séquentielles.

Le travail guidé par des profils senior

Contrairement à l’autocomplétion classique, souvent plus utile aux développeurs juniors, les agents profitent davantage aux profils expérimentés. L’étude identifie un “gradient d’expérience” : chaque écart-type supplémentaire dans l’ancienneté augmente de 5 à 6% le taux d’acceptation du code généré. Les seniors formulent des instructions plus riches en contexte, recourent davantage à la planification et évaluent plus précisément les propositions de l’agent. L’agent agit alors comme un accélérateur, amplifiant les capacités de ceux qui maîtrisent déjà la structure du code.

Une nouvelle manière de coder

Au-delà de la hausse de 39% de la production logicielle, l’étude met surtout en évidence une évolution structurelle du travail des développeurs. L’usage d’un agent de code modifie progressivement le travail du développeur : moins d’écriture manuelle et beaucoup plus de validation du code.

Mais le chercheur rappelle deux limites essentielles. D’une part, ces résultats dépendent fortement du domaine étudié : le développement logiciel fournit un feedback immédiat (tests, erreurs, merges), un terrain idéal pour mesurer objectivement productivité et qualité. D’autre part, l’environnement Cursor constitue un cas particulier : l’agent y bénéficie d’un accès complet au codebase, d’un contexte riche et d’outils de contrôle intégrés. Autrement dit, les performances observées ne sont pas généralisables à n’importe quel agent ni à n’importe quel contexte.

Les 4 domaines où les agents de code excellent

Les implémentations rapides de fonctionnalités

Les tâches de planification

Les explications de code et de bugs

Le travail guidé par des profils senior

Une nouvelle manière de coder