Avec Gemini 3, Google lance son IA "universelle" (et fait le plein de nouveautés)

Aux côtés de son nouveau modèle d'IA opérable dans tous les environnements, Google enrichit son application de capacités agentiques et multiplie les outils à destination des professionnels et du grand public.

Google frappe encore plus fort que d'habitude. Si on liste ne serait-ce qu'une partie des annonces de ce 18 novembre, il y a bien sûr la sortie de Gemini 3, son meilleur modèle d’IA générative à ce jour, qui combine des capacités multimodales de pointe (compréhension simultanée de texte, image, vidéo et code) et une puissance de raisonnement inégalée, mais en plus plusieurs fonctionnalités agentiques pour l'application Gemini et sa digital workplace et enfin une nouvelle plateforme de vibe coding encore plus intelligente.

Surtout, avec Gemini 3, Google ne se contente pas d’annoncer un nouveau modèle : l’entreprise revendique désormais une IA véritablement “universelle”, conçue pour fonctionner de manière homogène dans tous ses produits. C’est une première. Dès le jour du lancement, Gemini 3 est simultanément déployé dans Google Search, dans l’application Gemini, et dans l’ensemble des outils développeurs, via AI Studio, Gemini CLI et l’API. L’IA n’est plus un composant ajouté aux produits, mais une plateforme unifiée, capable d’opérer indifféremment dans le navigateur, dans une application mobile ou dans un environnement de développement.

Gemini 3 Pro, un modèle de raisonnement ultra-polyvalent

Gemini 3 est explicitement présenté par Google comme son modèle le plus intelligent. Il est considéré comme le meilleur modèle au monde pour la compréhension multimodale et la génération de code à la volée. Le modèle obtient 1501 points sur le LMSys Arena, dépassant de 50 points ELO le précédent détenteur du record... qui n'était autre que Gemini 2.5 Pro. En analyse multimodale sur MMMU Pro, le modèle atteint les 81%. En génération de code, le modèle performe également : le modèle obtient 76,2 % sur SWE-Bench Verified (en un seul essai), une nette amélioration par rapport aux 59,6 % de Gemini 2.5 Pro. Même pour les problèmes de codage compétitif (LiveCodeBench Pro), Gemini 3 Pro enregistre un score plus élevé (2439) que son prédécesseur (1775).

"Gemini 3 Pro surpasse 2.5 Pro sur tous les benchmarks majeurs avec une marge significative", précise Tulsee Doshi, responsable produit pour les modèles Gemini chez Google DeepMind. Au-delà des chiffres, c'est surtout la qualité perçue qui ressort des premiers tests : "Les réponses sont plus utiles, plus concises, mieux formatées." La principale nouveauté ne réside pas uniquement dans les capacités du modèle, mais dans la stratégie de déploiement adoptée par Google. Pour la première fois, Gemini 3 arrive simultanément dans l'application Gemini, dans le mode AI de Google Search (plus de 2 milliards d'utilisateurs mensuels pour les AI Overviews), et dans les outils développeurs via AI Studio et l'API Gemini.

Gemini 3 Deep Think : la réflexion parallèle poussée à l'extrême

Google introduit également Gemini 3 Deep Think, un mode de raisonnement avancé qui repousse encore plus loin les capacités du modèle. Ce mode, qui sera disponible dans les semaines à venir pour les abonnés Google AI Ultra, s'appuie sur une approche différente du raisonnement classique des LLM. "Contrairement au raisonnement habituel qui génère des tokens de réflexion de manière séquentielle, Deep Think crée une structure de raisonnement parallèle", explique Koray Kavukcuoglu, CTO de DeepMind. "Le modèle explore différentes hypothèses en parallèle, puis utilise ses capacités pour sélectionner la meilleure conclusion."

Deep Think n'est pas conçu pour les requêtes quotidiennes, mais pour les problèmes qui se situent aux frontières des capacités humaines et de l'IA, explique Google. L’entreprise met en avant plusieurs catégories de problèmes où ce mode excelle : mathématiques avancées, algorithmique complexe, analyse de données, problèmes multi-contraintes en ingénierie…

Comme pour les précédentes sorties, les grilles tarifaires devraient être rendues publiques dans les heures suivant la publication du modèle.

L’application Gemini s’enrichit

Avec 650 millions d'utilisateurs actifs mensuels et un triplement des requêtes quotidiennes sur le dernier trimestre, l'application Gemini connaît une croissance fulgurante. Google profite du lancement de Gemini 3 pour introduire plusieurs fonctionnalités directement dans l’application Gemini.

Gemini Agent : un agent généraliste dans la suite Workspace

La fonctionnalité la plus ambitieuse lancée en expérimental est sans doute le mode "Agent". L’outil représente “la première étape vers un véritable agent généraliste, quelque chose qui pourra travailler à travers vos différents produits Google quand vous lui donnez le contrôle", explique Josh Woodward, VP en charge de Google Labs et Gemini.

“Aujourd'hui, si vous allez sur Gemini et tapez 'aide-moi à contrôler ma boîte mail', il vous donnera des stratégies générales sur comment archiver, déléguer, ou prendre des mesures. Demain, si vous faites cette requête avec Agent activé, il vous permettra de prendre des actions personnalisées en votre nom”, détaille le VP.

"Agent Gemini"

Par exemple, si le propriétaire d’une petite entreprise demande simplement "aide-moi à contrôler ma boîte de réception”, Gemini va agir pour lui. L'agent décompose alors automatiquement la demande en tâches identifiées, crée un plan structuré visible en vue d'ensemble, et catégorise les différents messages. L'utilisateur peut ensuite sélectionner certaines tâches pour les ajouter à son Google Calendar ou les rejeter, tandis que l'agent rédige des brouillons de réponses prêts à être envoyés aux clients.

Visual Layout : des interfaces immersives générées à la volée

Disponible dans la section Labs de l'application, Visual Layout permet à l’utilisateur de guider l’utilisateur dans sa requête en utilisant une expérience nouvelle proche du widget interactif. Par exemple si l’utilisateur demande à Gemini de l’aider à planifier un voyage en Italie, le modèle interagira avec lui en utilisant des éléments de saisis d’informations (formulaire, checkbox, ascenseur…). C’est un véritable retour à l’interface.

"Visual"

Dynamic View : pour faciliter l’apprentissage

Egalement disponible en expérimental dès le lancement, Dynamic View pousse encore plus loin les capacités agentiques de Gemini 3 en codant des expériences interactives complètes. Par exemple, si l'utilisateur pose une question sur Van Gogh. Gemini 3 génère alors une mini site-web live permettant de naviguer étape par étape à travers la carrière du peintre, avec des explications détaillées et des informations contextuelles pour chaque période.

"Gemini App"

Google Antigravity : la nouvelle plateforme de vibe coding de Google

Autre grande nouveauté : Google annonce l’arrivée d’une nouvelle plateforme de vibe coding. Nommée Antigravity, cette dernière repense fondamentalement la manière dont les développeurs interagissent avec l'IA. L'innovation majeure d'Antigravity réside dans l'intégration de la capacité "computer use", une fonctionnalité qui manquait cruellement aux agents de code existants. Concrètement, l'agent peut désormais opérer de manière autonome à travers trois environnements simultanément : l'éditeur de code, le terminal, et un navigateur Chrome intégré.

"Google Antigravity"

Là où les agents de code classiques se limitent à générer du code que le développeur doit ensuite tester manuellement, l'agent Antigravity peut lui-même lancer l'application dans le navigateur, interagir avec l'interface comme le ferait un utilisateur, identifier les bugs ou les problèmes d'ergonomie, puis retourner dans l'éditeur pour corriger le code. A chaque étape, le développeur peut intervenir, modifier des tâches, ajouter des commentaires ou des instructions spécifiques, puis laisser l'agent reprendre son travail. Antigravity intègre Gemini 3 Pro, mais aussi le modèle Gemini 2.5 pour le "computer use" (contrôle du navigateur) et Imagen 3 pour la génération d'images. La preview publique arrivera prochainement sur Mac, Windows et Linux.