Nouveauté ChatGPT : Codex fait (presque) tout le travail des développeurs

Nouveauté ChatGPT : Codex fait (presque) tout le travail des développeurs L'agent d'OpenAI annoncé ce 16 mai est capable de coder, corriger et documenter en totale autonomie en utilisant un dépôt GitHub.

OpenAI continue de frapper fort sur le code. La start-up de San Francisco présente ce vendredi 16 mai Codex, un nouvel agent autonome de code. Fonctionnant dans un environnement cloud isolé, Codex peut non seulement écrire du code, mais aussi répondre à des questions sur une base de code, corriger des bugs et même proposer des pull requests. 

Un agent de code autonome 

Propulsé par codex-1, une version optimisée du modèle o3 spécialement conçue pour l'ingénierie logicielle, Codex est entraîné par apprentissage par renforcement sur des tâches de programmation réelles. Chaque agent Codex s'exécute dans un conteneur cloud dédié, préchargé avec le dépôt de code de l'utilisateur et totalement déconnecté d'internet. L'agent peut lire et modifier des fichiers, exécuter des tests. Les tâches sont réalisées dans un délai de 1 à 30 minutes selon leur complexité.

Codex peut générer de nouvelles fonctionnalités dans le code, répondre à des questions sur l'architecture d'un projet, effectuer des refactoring complexes, écrire des tests unitaires ou encore de de la documentation technique. L'agent est également capable d'aller au-delà de la simple génération de code : il analyse les problèmes récurrents dans le code, les incohérences de configuration, et propose des améliorations. Il peut détecter et corriger des bugs, suggérer des optimisations de performance, et même générer des propositions de pull requests.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.
L'interface de Codex. © OpenAI

L'agent intégré directement dans ChatGPT

Codex s'intègre directement dans l'interface de ChatGPT via une nouvelle section latérale dédiée. Les développeurs peuvent interagir avec l'agent de deux manières : en cliquant sur Code pour lancer une nouvelle tâche de développement, ou sur Ask pour poser des questions sur un dépôt existant. Chaque tâche est exécutée indépendamment dans un environnement cloud isolé avec le code projet. L'utilisateur peut suivre la progression en temps réel et recevoir un compte-rendu des opérations effectuées. Une fois la tâche terminée, il est possible de demander des révisions, d'ouvrir directement une pull request sur GitHub, ou d'intégrer les modifications dans l'environnement local. L'agent peut également être guidé par un fichier AGENTS.md (sur le principe de Readme) en spécifiant les conventions de code, les instructions de test et les pratiques du projet.

L'interface de Codex dans ChatGPT. © OpenAI

L'agent est lancé à partir de ce 16 mais pour les utilisateurs ChatGPT Pro, Entreprise et Teams, avec une extension prévue pour Plus et Education dans les prochaines semaines. Le service sera initialement proposé sans coût supplémentaire mais avec des limites de requête. Il sera par ailleurs possible d'acheter des requêtes supplémentaires.

L'agent sera également disponible dans l'API sous le nom de codex-mini-latest. Le modèle est accessible via l'API Responses et est facturé à 1,50 $ pour 1 million de tokens d'entrée et 6 $ pour 1 million de tokens de sortie, avec une remise de mise en cache de 75%. Il est possible de l'utiliser pour des tâches simples de factorisation de code, génération de documentation ou encore correction de bugs. 

Pour OpenAI, le métier de développeur se transforme 

OpenAI imagine un futur (proche, très proche ?) où les développeurs piloteraient stratégiquement leurs projets tout en déléguant les tâches répétitives ou techniques à des agents intelligents. L'objectif est de permettre aux ingénieurs de se concentrer sur l'innovation et la créativité, en laissant l'IA gérer les aspects plus routiniers du développement logiciel. A terme, la start-up prévoit une collaboration fluide entre humains et agents, où ces derniers pourront travailler en asynchrone et proposer des mises à jour proactives. 

Aujourd'hui, l'agent permet de gagner du temps et d'automatiser certaines tâches, mais il ne remplace pas les développeurs. OpenAI reste volontairement vague sur l'impact à long terme mais termine son laïus par une pensée éloquente : "it's juste the beginning."