Cloud orienté IA : quelle offre est la moins chère ?
Le JDN a passé au crible les prix pratiqués par les principaux cloud orientés dans l'intelligence artificielle. A ce petit jeu des tarifs, c'est le français Sesterce qui arrive en tête avec des tickets particulièrement bas. Les tarifs d'entrée de ses instances H100 et H200 s'élèvent respectivement à 1,79 et 2,48 dollars par heure. Il fait mieux que le géant américain CoreWeave qui affiche des instances équivalentes se situant respectivement à 4,25 et 6,3 dollars par heure.
Du côté des hyperscalers, Microsoft et Google sont distancés par les pure player avec des instances H100 qui affichent 11 à 12 dollars de l'heure. On estime qu'il faut mobiliser de 500 à 1 000 GPU pendant deux à quatre semaines pour entraîner un modèle de 100 milliards de paramètres. Face à ces chiffres, on comprend pourquoi OpenAI préfère se tourner vers CoreWeave dont les prix se situent entre 4 et 6 dollars pour entraîner et inférer ChatGPT, plutôt que vers Microsoft. On comprend aussi pourquoi les hyperscalers n'hésitent pas à faire appel aux spécialistes pour se fournir en GPU. Dans cette catégorie, seul AWS reste dans la course en pratiquant des prix aux alentours de 4 dollars.
Le modèle des spécialistes est simple. Ils se fournissent auprès de Nvidia en achetant des GPU en masse à prix négociés. Ce qui leur permet ensuite de pratiquer des politiques de prix agressives. C'est là leur principale marque de fabrique. Ils ne se positionnent pas sur les couches d'IA générative as a Service préférant laisser ce positionnement aux clouds généralistes.
Fournisseur | H100 | H200 |
---|---|---|
AWS EC2 | Environ 3,93 dollars/h par GPU pour une p5.48xlarge (80 GB de vRam, niveau de RAM non communiqué) | Environ 4,33 dollars/h par GPU (141 GB de vRam, 1 128 GB de RAM) |
CoreWeave | Environ 4,25 dollars/h par GPU (80 GB de vRam, 256 GB de RAM) | Environ 6,3 dollars/h par GPU (141 GB de vRam, 2 048 GB de RAM) |
Google Cloud | Environ 11,06/h dollars par GPU pour une instance a3-highgpu-1g (234 de RAM) | Prix non communiqué |
Lambda Labs | Environ 2,70 dollars/h (vRam et RAM non communiquées) | Prix non communiqué |
Microsoft Azure | Environ 12,30 dollars/h par GPU pour une ND H100 v5 (80 GB de vRam, 640 GB de RAM) | Prix non communiqué |
OVHcloud | Environ 2,80 dollars/h par GPU (80 GB de vRam, 380 GB de RAM) | Prochainement disponible |
Scaleway | Environ 2,73 dollars/h par GPU (80 GB de vRam, 240 GB de RAM) | Prochainement disponible |
Sesterce | Environ 1,79 dollar/h par GPU (80 GB vRam, capacité de RAM non-communiqué) | Environ 2,48 dollars/h par GPU (80 GB de vRam) |
Chaque valeur indique le prix d'entrée du GPU par heure, ainsi que la mémoire RAM et la mémoire de l'accélérateur associées. Les données proviennent des pages officielles des fournisseurs ou de leur calculateur de capacité machine.