Amazon Bedrock vs Google Vertex AI vs Microsoft Azure : Google Cloud se détache dans l'IA générative
C'est une course à l'échalote. Amazon, Google et Microsoft mettent les bouchées doubles pour proposer les meilleurs services cloud d'IA générative. Pour la plupart des experts interrogés, si les trois offres se ressemblent dans les grandes lignes, elles n'en affichent pas moins des particularités. Au final, on note une avance assez claire du côté de Google. Mais la course n'est pas finie...
Amazon Bedrock | Google Vertex AI | Microsoft Azure OpenAI | |
---|---|---|---|
Multimodal | X | XX | X |
RAG | XX | XX | X |
Déploiement et passage à l'échelle | X | XX | X |
Agentique | XX | X | X |
Souveraineté | |||
GPU | X | X | X |
Première différence notable : un positionnement différent sur le plan des modèles. Sur ce terrain, Microsoft capitalise sur son partenariat historique avec OpenAI dans lequel il a investi 10 milliards de dollars. Il est à ce jour le seul cloud à proposer les modèles d'OpenAI aux côtés de l'offre historique commercialisée par ce dernier. Amazon Web Services (AWS), lui, a investi 8 milliards de dollars dans Anthropic. Le cloud de Seattle met donc tout naturellement en avant le modèle (Claude) de la scale-up. AWS se veut néanmoins agnostique en termes de modèles. Il en propose plusieurs dizaines en catalogue. Quant à Google, c'est le seul des trois acteurs à promouvoir un modèle fait maison performant avec Gemini. AWS a bien lancé son propre modèle (Nova) fin 2024 mais celui-ci n'a depuis pas été mis à jour. Il est par conséquent largement distancé dans les benchmarks.
Gemini redresse la barre
"Via Gemini, Google a rattrapé son retard. C'est notamment le cas en matière de raisonnement, de recherche web malgré des lenteurs, mais aussi d'IA multimodale, notamment grâce à Youtube", commente Didier Gaultier, head of AI digital services France au sein d'Orange Business. "Youtube a pour avantage de contenir à la fois de la vidéo, du son et du texte. Ce qui en fait une base de données idéale pour le multimodal."
Nicolas Cavallo, head of generative AI chez Octo Technology, confirme en partie cette analyse. "Gemini a clairement un avantage en matière de traitement de vidéo là où Claude sera meilleur pour générer du code", estime-t-il. Et Nicolas Gaudemet, chief AI officer chez Onepoint d'ajouter : "Gemini a également pour avantage d'offrir des fenêtres de contexte très large, ce qui lui permet d'accueillir des prompts et des conversations très longues (de plus d'un million de jetons par jour, ndlr)."
Côté pipeline de machine learning, Didier Gaultier salue le travail réalisé par Google en matière d'intégration. "C'est l'un des points forts de Vertex AI", souligne-t-il. Du côté d'Amazon et de Microsoft, il sera nécessaire de faire appel à des outils tiers, SageMaker pour le premier et Azure Machine Learning pour le second. Idem sur le front du déploiement et de la gestion de l'autodimensionnement des ressources machines sous-jacentes. Vertex AI propose une solution intégrée qui est jugée très bien conçue. Côté AWS, il sera nécessaire là-encore de faire appel à SageMaker. Quant à Microsoft Azure, il propose notamment les Azure ML Endpoints pour gérer les mises en œuvre et le passage à l'échelle. "Les services managés des providers permettent d'aboutir à un résultat rapidement. En revanche, ils impliquent une adhérence dont il sera difficile de se défaire, qui compliquera la portabilité des applications d'IA vers d'autres plateformes", commente Nicolas Gaudemet.
"Côté RAG, Google se démarque clairement en capitalisant sur son historique en matière de recherche"
Sur le plan de l'ergonomie, les trois solutions se valent. "Sur ce point, on aura tendance à s'orienter vers l'outil qui rejoint le cloud que l'on maîtrise", constate Didier Gaultier. En matière de RAG (ou génération augmentée de récupération), le consultant d'Orange Business estime qu'AWS se hisse en tête. Renforçant sa position sur ce terrain, le cloud d'Amazon a annoncé récemment l'intégration de la vectorisation à son service de stockage orienté objet S3. Ce n'est pas l'avis de Nicolas Cavallo d'Octo Technology. "Côté RAG, Google se démarque clairement en capitalisant sur son historique en matière de recherche. Il a clairement une longueur d'avance dans ce domaine", insiste-t-il.
Reste un argument massue qui reste en faveur d'Amazon : le cloud de Seattle peut toujours mettre en avant l'extrême richesse fonctionnelle de ses services tiers qui pourront venir renforcer la puissance des applications d'IA générative développées.
Autre point fort du cloud d'Amazon : l'agentique. A l'occasion de l'AWS Summit New York qui se tenait mi-juillet, le groupe de Jeff Bezos a dévoilé une plateforme très complète taillée pour gérer l'ensemble du cycle de vie des agents d'IA. Permettant de les déployer en mode serverless, cette solution baptisée Bedrock AgentCore gère la mémoire allouée à chacun d'eux, mais aussi leur interaction avec le web ainsi qu'avec les outils tiers via un serveur MCP. Pour l'heure, Google et Microsoft ne vont pas si loin. Ils se contentent de proposer des services se limitant à la phase de développement des agents (lire l'article : AWS lève le voile sur sa plateforme agentique).
Sur le plan des GPU, AWS, Google et Microsoft sont tous les trois globalement très chers (lire l'article Cloud orienté IA : quelle offre est la moins chère ?). Autre point faible : ils ne laissent que peu de choix en matière de région cloud en Europe. Aucun d'eux ne proposent de GPU sur le territoire français.
Une question demeure également en suspens chez les trois hyperscalers : la souveraineté. Une interrogation à laquelle les trois fournisseurs apportent la même réponse, le chiffrement. Objectif affiché : garantir que l'hyperscaler ne pourra pas accéder aux données de ses clients et, a fortiori, les fournir aux autorités américaines. Problème : Amazon, Google comme Microsoft proposent certes tous des services de chiffrement, mais avec leurs propres clés de cryptage. Ce qui ne ferme pas la porte à une telle procédure.
Vers des IA souveraines ?
Les initiative Bleu et S3NS respectivement portées par Microsoft et Google pourraient bien permettre de résoudre cette délicate équation. Leur philosophie ? Commercialiser les offres des deux hyperscalers via des structures juridiques distinctes (portées par Orange et Capgemni pour le premier et Thales pour le second). Ces offres sont en cours de lancement. Toutes deux sont entrées en début d'année dans le processus de labellisation SecNumCloud portée par l'Agence nationale de la sécurité des systèmes d'information. Une certification qui vise à garantir leur caractère souverain.