Peter Steinberger (OpenClaw/OpenAI), Thibault Sottiaux (OpenAI) "La première version d'OpenClaw, je l'ai codée en une heure"

Une première version codée en une heure, puis un agent IA devenu viral : en six mois, Peter Steinberger est passé de développeur anonyme à pilote des agents de nouvelle génération chez OpenAI.

Peter Steinberger, responsable d'OpenClaw et membre de l'équipe Codex d'OpenAI. © OpenAI

JDN. A l’origine, comment vous est venue l'idée de créer OpenClaw ? Combien de temps le développement initial a-t-il pris ?

Peter Steinberger. Je me suis lancé dans l'agentic engineering en avril 2025, et dès mai j'ai voulu pouvoir solliciter mon agent à distance. J'en ai construit une première version, un terminal accessible sur le web et sur mobile, mais l'usage restait peu naturel sur un téléphone. J'ai abandonné, convaincu que les grands laboratoires allaient rapidement proposer ce type d'outil. Le besoin est réapparu vers novembre. Comme aucun acteur n'avait rien développé, je l'ai fait moi-même.

La première version fonctionnelle, sur Codex, a été construite en une heure. Mais une heure n'est jamais vraiment une heure : l'ajout du support des images en a demandé plusieurs. L'outil s'est révélé assez utile pour que je continue à l'affiner jusqu'à obtenir une expérience satisfaisante. Le résultat est vite devenu bluffant, porté par un contexte favorable : les modèles ont atteint un excellent niveau en programmation. Or programmer relève avant tout de la résolution de problèmes, une compétence qui se transpose à de nombreux autres usages. On confie une tâche à l'agent, et il la résout. C'est l'équivalent de lui donner accès à son poste de travail, et du jour au lendemain je disposais de cette capacité directement sur WhatsApp.

Comment expliquez-vous le succès immédiat d’OpenClaw ?

Peter Steinberger. Jusque-là, les agents IA restaient cantonnés au terminal, un environnement rebutant pour beaucoup d'utilisateurs. OpenClaw a rendu l'expérience plus accessible et plus naturelle, et c'est ce qui a déclenché le fameux moment magique : ces utilisateurs ont confié à l'agent une tâche en doutant qu'elle aboutisse, et elle a abouti. Ce premier essai réussi provoque un effet “waouh”.

Thibault Sottiaux, responsable du Core Product & Platform chez OpenAI. © OpenAI

Thibault Sottiaux. Peter est un builder et un visionnaire : il va là où les autres pensent ne pas pouvoir aller, avec ténacité et la capacité à voir grand. A cela s'est ajouté le bon timing, avec des modèles devenus assez performants pour qu'un projet qui semblait hors de portée prenne vie. Il y a aussi eu cette construction en public, au sein de l'open source : Peter développait l'outil tout en le montrant en temps réel, les gens étaient avec lui sur Discord. C'est toute la beauté de l'open source : on échange des idées et on les réintègre dans notre core agent.

En développant OpenClaw, qu’avez-vous appris concrètement sur le fonctionnement des boucles agentiques ?

Peter Steinberger. La boucle agentique est en réalité très simple, presque le “hello world” d'un agent. Créer la boucle est simple, mais la rendre réellement performante devient infiniment complexe. Le computer use en est un bon exemple : on peut dire à l'agent “prends le relais et termine ça”, et il déplace la souris et clique à votre place. Très utile, mais très difficile à construire.

Vous avez lancé OpenClaw, puis vous avez rejoint OpenAI. Pourquoi OpenAI en particulier ?

Peter Steinberger. Quand le projet a explosé, je ne me suis pas demandé si je devais en faire une entreprise. Je venais de passer plusieurs années à diriger ma propre société et je ne voulais pas recommencer. Surtout, monter une entreprise aurait risqué d'affaiblir l'open source, par conflit d'intérêts. L'alternative était de rejoindre un laboratoire, ce dont j'ai toujours été curieux. OpenAI m'a permis de placer OpenClaw dans une fondation à but non lucratif : je peux ainsi mener deux activités de front. Rester indépendant laisse le choix aux utilisateurs, et il est appréciable qu'OpenAI me laisse continuer à le développer, y compris en prenant en charge d'autres modèles.

Je partage donc mon temps entre OpenClaw et des projets plus ambitieux chez OpenAI. C'est encore plus intéressant aujourd'hui : nous avons fourni un gros effort pour le rendre prêt pour l'entreprise. OpenClaw s'utilise en standalone, au-dessus de Codex ou de Copilot, le harness étant lui-même devenu un plugin.

Les entreprises peuvent-elles aussi utiliser les agents OpenClaw ? Pour quels cas d'usage ?

Thibault Sottiaux. Nous les accompagnons et commençons à le supporter officiellement dans notre offre entreprise. OpenClaw tourne très bien au-dessus des modèles OpenAI, au prix d'un travail considérable. Des idées précoces comme la mémoire ou les heartbeats sont devenues des implémentations natives dans Codex, ce qui nourrit notre agent généraliste, déployé partout chez OpenAI et bientôt dans ChatGPT. La boucle est complète : Codex a inspiré OpenClaw, qui a en retour inspiré Codex. Nous le rendons désormais accessible bien au-delà des développeurs.

Comment voyez-vous l'avenir des agents personnels ? Chacun aura-t-il son propre agent, avec son propre contexte ?

Thibault Sottiaux. C'est exactement ce que nous construisons. Nous pensons que chacun disposera d'une AGI personnelle, profondément individualisée : elle comprend votre routine, vos préférences et vos objectifs de long terme, et devient utile dans votre vie privée comme au travail. Dès lors, votre rapport aux autres applications change radicalement. OpenAI est aussi pionnier de la multimodalité : interagir en langage naturel plutôt qu'au clavier, avec un modèle de génération d'images à l'état de l'art. Tout cela converge vers une expérience très naturelle, qui nous affranchit même de l'ordinateur.

Anthropic nous dit que faire tourner des agentic systems 24 heures sur 24 est un objectif à atteindre dans les prochains mois. Est-ce aussi un objectif pour votre équipe ?

“Un agent peut tourner des jours, des semaines, j’en ai même vu un fonctionner un mois”

Thibault Sottiaux. Notre objectif n'est pas de faire tourner des agents en permanence, mais de créer de la valeur de la manière la plus efficace possible. La vraie question est celle du retour sur investissement : accomplir un travail d'excellent niveau au coût le plus bas. Cela dit, de nombreux cas d'usage justifient un assistant actif en continu, et nos modèles, depuis GPT-5, 5.2, 5.4 et 5.5, sont reconnus pour exceller sur les tâches de longue durée. Nous avons d'ailleurs livré la commande /goal, l'une de mes fonctionnalités préférées : vous fixez un objectif, et l'agent peut travailler pendant des jours. Pour nous, ce n'est plus un cap à atteindre, c'est déjà une réalité : avec Codex, un agent peut tourner des jours, des semaines, j'en ai même vu un fonctionner un mois. Mais la durée n'est pas le but ; le but, c'est de réaliser des tâches remarquables au bon coût.

Certains chercheurs en IA estiment que le harness autour du modèle représente la majorité de l'intelligence d’un agent ? Etes vous en accord avec cela ?

Peter Steinberger. Le meilleur harness ne vaut rien avec un modèle faible, et le meilleur modèle reste inefficace sans bonnes capacités d'action. C'est tout l'intérêt de Codex : il est optimisé pour les modèles GPT, et le développement avance main dans la main, le modèle connaissant Codex et inversement.

Thibault Sottiaux. Les bons modèles réclament de la simplicité et moins de contraintes. Les harnesses étaient autrefois plus complexes, car il fallait beaucoup guider un modèle incapable de manier un large éventail d'outils sans se perdre. Cette complexité a été retirée modèle après modèle, à mesure qu'on constatait que certaines contraintes n'aidaient plus l'agent. Dans cette quête de généralité, plus les capacités progressent, plus le harness se simplifie. Nous travaillons d'ailleurs directement avec les ingénieurs des modèles, côte à côte depuis les débuts de Codex. C'est ce qui a rendu le projet magique : nous co-concevons à la fois les modèles et l'application, et le harness lui-même est construit conjointement par la recherche, l'ingénierie et le produit.

Quelle est la suite logique pour Codex et OpenClaw ? Faut-il s'attendre à une fusion dans les prochains mois ?

"ChatGPT sera bientôt capable d'en faire bien davantage"

Peter Steinberger. Pas du tout. L'idée est plutôt de reprendre les meilleures idées d'OpenClaw pour les intégrer à Codex, et inversement.

Prévoyez-vous alors d'ajouter un module OpenClaw dans ChatGPT ?

Thibault Sottiaux. Ce n'est pas notre angle. Notre réflexion porte sur la manière de prendre le meilleur des capacités agentiques existantes, qu'elles viennent d'OpenClaw ou de Codex, et de l'apporter à tous dans ChatGPT, pour le rendre largement accessible. C'est avant tout une question de capacités, de ce que l'utilisateur peut accomplir. Et nous voulons un système simple et agréable, jamais déroutant : le ChatGPT que vous connaissez déjà, capable d'en faire bien davantage.