Google a annoncé ce mardi 14 mars intégrer de l'IA dans ses offres cloud et Workspace. De son côté, OpenAI annonce GPT-4, une IA générative multimodale.

La guerre entre OpenAI et Google autour de l'IA ne fait que commencer. Pour cette bataille du 14 mars, Google a annoncé ses nouveautés en matière d'IA en début d'après-midi, OpenAI lui a répondu en fin de journée ! Le premier a dévoilé dé fonctionnalités IA pour Google Cloud et Google Workspace, destinées aux développeurs et aux utilisateurs professionnels, le second a lancé en grande pompe la nouvelle version de son IA, GPT-4.

Google Workplace : les applications Docs, Slides et Gmail principalement concernées

Les innovations annoncées par Google relatives à l'IA se répartissent en deux catégories : les fonctionnalités réservées aux développeurs et celles pour les collaborateurs en entreprise. En ce qui concerne cette deuxième catégorie, les prouesses réalisées par l'IA seront visibles à travers les services Workspace. Sur le service de messagerie Gmail, l'intelligence artificielle sera notamment capable de générer des réponses automatiques à un mail ou encore de résumer une conversation de plusieurs messages. Sur Google Docs, elle pourra générer du texte pour divers tâches, et devrait s'avérer très compétente pour les contenus relatifs au copywriting et au marketing. De manière générale, les vidéos "teasing" publiées par Google montrent que l'accent a été mis sur le design. D'ailleurs, sur Google Slides, l'IA sera capable de proposer des présentations autour d'un thème précis en générant des images et même un fond sonore.

Google Cloud : les modèles de langage Google seront accessibles pour les développeurs

Pour les développeurs, Google va lancer l'API PaLM, une nouvelle offre qui permet d'expérimenter ses grands modèles de langage. Cette API sera livrée avec MarketSuite, "un outil qui permet aux développeurs de commencer à prototyper rapidement et facilement." Enfin, Google prévoit également le lancement de Generative AI App Builder, pour permettre aux entreprises de créer leurs propres interfaces de chat. Pour l'instant, toutes ces nouvelles fonctionnalités sont testées par un petit nombre d'entreprises et ne sont pas encore accessibles au grand public.

Après GPT-3, OpenAI présente l'IA générative multimodale

La principale nouveauté qui frappe lorsque l'on observe GPT-4 est sa capacité à prendre des images en compte tout comme elle le fait avec du texte. En lui montrant une image, GPT-4 est capable de la décrire et de l'analyser comme GPT-3 le fait avec du texte. Concrètement, si on lui demande ce qu'il se passerait si on coupait une ficelle qui retient des ballons, sa réponse fuse : "ils s'envoleraient !".

Toutefois, et contrairement à Dall-E, l'IA générative d'images d'OpenAI, ses réponses se limitent à du texte. Au-delà, de cette différence, OpenAI promet que GPT-4 sera plus "fiable, créatif, et nuancé" et capable de résoudre des problèmes complexes, comme le montre la comparaison des taux de réussite de GPT 3.5 et GPT 4 à différents examens ci-dessous.

© OpenAI

Dans la foulée de cette annonce, Sam Altman, CEO d'OpenAI, a annoncé que GPT-4 était d'ores et déjà disponible dans l'API (sur liste d'attente) ainsi que dans ChatGPT+. Microsoft, lui, a annoncé que Bing tournait déjà sous GPT-4.