Cloud orienté IA : quelle offre est la moins chère ?

Entre AWS, Google Cloud et Microsoft Azure, quel est l'hyperscaler affichant les prix les plus bas ? Font-ils le poids face à leurs concurrents spécialisés dans l'IA au premier rang desquels CoreWeave et Lambda Labs ?

Le JDN a passé au crible les prix pratiqués par les principaux cloud orientés dans l'intelligence artificielle. A ce petit jeu des tarifs, c'est Oracle (et non Sesterces comme indiqué précédemment) qui arrive en tête avec des tickets particulièrement bas. Le tarif d'entrée de ses instances H100 et H200 s'élève à 1 dollar par heure. Il fait mieux que le spécialiste américain CoreWeave qui affiche des instances équivalentes se situant respectivement à 4,25 et 6,3 dollars par heure.

Du côté des hyperscalers, Microsoft et Google sont distancés par les pure player avec des instances H100 qui affichent 11 à 12 dollars de l'heure. On estime qu'il faut mobiliser de 500 à 1 000 GPU pendant deux à quatre semaines pour entraîner un modèle de 100 milliards de paramètres. Face à ces chiffres, on comprend pourquoi OpenAI préfère se tourner vers CoreWeave dont les prix se situent entre 4 et 6 dollars pour entraîner et inférer ChatGPT, plutôt que vers Microsoft. On comprend aussi pourquoi les hyperscalers n'hésitent pas à faire appel aux spécialistes pour se fournir en GPU. Dans cette catégorie, seul AWS reste dans la course en pratiquant des prix aux alentours de 4 dollars.

Le modèle des spécialistes est simple. Ils se fournissent auprès de Nvidia en achetant des GPU en masse à prix négociés. Ce qui leur permet ensuite de pratiquer des politiques de prix agressives. C'est là leur principale marque de fabrique. Ils ne se positionnent pas sur les couches d'IA générative as a Service préférant laisser ce positionnement aux clouds généralistes.

Comparaison des prix des instances H100 et H200 des principaux fournisseurs de cloud orientés IA
Fournisseur	H100	H200
AWS EC2	Environ 3,93 dollars/h par GPU pour une p5.48xlarge (80 GB de vRam, niveau de RAM non communiqué)	Environ 4,33 dollars/h par GPU (141 GB de vRam, 1 128 GB de RAM)
CoreWeave	Environ 4,25 dollars/h par GPU (80 GB de vRam, 256 GB de RAM)	Environ 6,3 dollars/h par GPU (141 GB de vRam, 2 048 GB de RAM)
Google Cloud	Environ 11,06/h dollars par GPU pour une instance a3-highgpu-1g (234 de RAM)	Prix non communiqué
Lambda Labs	Environ 2,70 dollars/h (vRam et RAM non communiquées)	Prix non communiqué
Microsoft Azure	Environ 12,30 dollars/h par GPU pour une ND H100 v5 (80 GB de vRam, 640 GB de RAM)	Prix non communiqué
Oracle	Environ 1 dollar/h par GPU (80 GB)	Environ 1 dollar/h par GPU (80 GB)
OVHcloud	Environ 2,80 dollars/h par GPU (80 GB de vRam, 380 GB de RAM)	Prochainement disponible
Scaleway	Environ 2,73 dollars/h par GPU (80 GB de vRam, 240 GB de RAM)	Prochainement disponible
Sesterce	Environ 1,79 dollar/h par GPU (80 GB vRam, capacité de RAM non-communiqué)	Environ 2,48 dollars/h par GPU (80 GB de vRam)

Chaque valeur indique le prix d'entrée du GPU par heure, ainsi que la mémoire RAM et la mémoire de l'accélérateur associées. Les données proviennent des pages officielles des fournisseurs ou de leur calculateur de capacité machine.