A l'occasion de l'ouverture de son bureau à Paris, OpenAI a présenté sa vision d'lA dans un futur proche. Voici ce qu'il faut en attendre.

Neuf ans après son lancement à San Francisco, OpenAI débarque en France. La start-up s'est officiellement installée à Paris ce jeudi 14 novembre pour son second bureau en Europe après le Royaume-Uni. A cette occasion, plusieurs cadres de l'entreprise étaient en mission d'évangélisation auprès des sociétés françaises et d'une partie de la presse, dont le JDN. La start-up nous a présenté ses dernières innovations en matière d'IA générative et dressé sa feuille de route pour les prochains mois. Nouvelles capacités pour o1 preview, développement d'agents autonomes, poursuite de la recherche de l'AGI, diminution des coûts… Voici ce qu'il faut attendre de la part du géant américain de l'IA.

La poursuite de la quête vers l'AGI, l'open source en second plan

C'est la mission première d'OpenAI depuis sa création : parvenir à une intelligence artificielle générale. Cette quête s'articule, dans la communication d'OpenAI, dans une ambition de "servir le bien commun" en respectant l'éthique et l'accessibilité de l'IA au plus grand nombre. Pour parvenir à cet objectif, les équipes de recherche se concentrent sur les frontier models, les modèles d'IA les plus avancés et les plus puissants du marché. Des modèles propriétaires qui s'éloignent de la vision originale open source de l'entreprise.

"Notre focus se situe essentiellement à la frontière de l'innovation, dans un contexte où il existe déjà d'excellents modèles open-source sur le marché. Bien que nous souhaitions nous investir davantage dans l'open-source à terme, ce n'est pas notre priorité actuelle", nous explique un des porte-paroles.

La version finale de o1 "dans les prochaines semaines"

Pour parvenir à l'AGI, l'entreprise compte notamment sur de nouveaux modèles de raisonnement et sur son flagship o1 preview. Ce dernier repose sur le principe de la chain of thought et du test time compute. "Auparavant, avec des modèles comme GPT-4, lorsqu'on envoyait un prompt, la réponse était construite de manière linéaire et définitive, token par token. L'amélioration des performances passait principalement par l'augmentation de la taille des clusters de recherche et des ressources humaines. Aujourd'hui, nous avons débloqué avec o1 preview une nouvelle capacité, encore à ses débuts, qui permet de combiner des modèles plus grands avec une puissance de calcul accrue en sortie", rappellent nos interlocuteurs.

Le modèle encore en preview aujourd'hui devrait sortir dans sa version finale complète "dans les prochaines semaines". Le modèle devrait supporter à terme la majorité des outils déjà supportés par GPT-4o utiles aux développeurs : structured output, function calling… Enfin, OpenAI prévoit de pousser encore plus loin le raisonnement de o1 : "Aujourd'hui, o1 prend une minute pour réfléchir à une tâche. Dans le futur, on peut imaginer qu'un tel modèle, face à des tâches très complexes nécessitant l'exploration de milliers de possibilités et un raisonnement approfondi, pourrait prendre plusieurs minutes pour y réfléchir."

Parallèlement, OpenAI devrait continuer ses travaux dans la multimodalité autour de GPT-4o pour le rendre encore plus naturel et fluide à utiliser. Le but est d'apporter une cohérence et une meilleure interopérabilité entre les modèles de raisonnement et ceux multimodaux.

2025 : l'année des agents

OpenAI en est sûr, 2025 sera l'année des agents IA. Toute la stratégie agentique d'OpenAI repose autour de o1. Les chercheurs d'OpenAI estiment que le raisonnement avancé de o1 était la brique manquante pour permettre le développement d'agents véritablement autonomes et fiables. "Avant, les gens faisaient des démos intéressantes d'agents, mais c'était difficile de les déployer en production car on ne pouvait pas avoir une confiance totale dans leur capacité à prendre les bonnes décisions au bon moment", explique un porte-parole de l'entreprise.

La pépite californienne de l'IA imagine des agents plus proactifs, capables d'agir de manière autonome pour le compte des utilisateurs. "On pourrait imaginer se réveiller le matin et découvrir que ses emails ont déjà été triés, son calendrier organisé, certains rendez-vous déplacés, simplement parce que l'agent intelligent aura été proactif, connaissant nos préférences et nos données", illustre encore notre interlocuteur.

La baisse des coûts va se poursuivre

Enfin OpenAI souhaite également poursuivre sa stratégie de réduction agressive des coûts pour ses clients. L'entreprise a réussi à diminuer le coût par token de 99% en seulement deux ans. Cette baisse s'appuie sur deux leviers principaux : l'optimisation des modèles permettant d'obtenir plus d'intelligence dans des tailles similaires ou équivalentes, et les économies d'échelle grâce aux 3 millions de développeurs et 250 millions d'utilisateurs actifs.

Pour aller plus loin, l'entreprise va continuer de déployer de nouvelles solutions d'optimisation. La "batch API" permet déjà 50% d'économies en programmant les tâches pendant les heures creuses des GPU. OpenAI propose également des réductions adaptées aux volumes d'utilisation au cas par cas avec ses clients directs.

Sur son outil de génération vidéo Sora, OpenAI reste prudent. Le modèle, toujours en research preview, continue d'évoluer mais aucune date de lancement n'est communiquée. L'équipe travaille étroitement avec des studios et des red teamers pour s'assurer que le modèle soit prêt pour tous les cas d'usage. "Ce qui est certain, c'est que l'investissement dans Sora continue. L'équipe poursuit l'amélioration du modèle."

Le bureau parisien, qui va prochainement recruter sur tous les métiers, de l'ingénierie à la recherche, servira de hub pour l'Europe continentale. Un futur bureau bruxellois se consacrera lui au lobbying auprès des instances européennes.