Les cloud spécialisés dans l'IA générative valent-ils le "coût" ?

Avec CoreWeave comme porte-drapeau, ces acteurs très verticaux se positionnent sur le marché en cassant les prix des GPU conçus pour entraîner et inférer les modèles d'intelligence artificielle.

CoreWeave, mais aussi Datacrunch, Lambda, Together AI... Toute une série de nouveaux acteurs ont vu le jour sur le terrain du cloud orienté IA. D'origine américaine, ils commercialisent des GPU à la demande pour entraîner ou inférer des modèles. Face aux hyperscalers du cloud généraliste que sont AWS, Google et Microsoft, ils se positionnent comme des spécialistes. Le plus célèbre d'entre eux, CoreWeave, compte parmi ses principaux clients Microsoft, avec qui il a signé cinq contrats pour un total de 10 milliards de dollars jusqu'en 2030. Il vient également de conclure un contrat de 11,9 milliards de dollars sur cinq ans avec OpenAI. Un accord qui prévoit l'acquisition par ce dernier d'une participation de 350 millions de dollars dans la société lors de son entrée en bourse prévue dans quelques semaines.

"Ces acteurs fournissent des GPU à la demande à très bas coûts. C'est là leur principale valeur ajoutée", constate Stéphane Roder., CEO du cabinet français AI Builders. "Leur objectif est de capter une partie du marché pour ensuite se faire racheter par un des hyperscalers." Recommande-t-il de se tourner vers ces offres ? "Compte-tenu de leur tarification, on aurait tort de s'en priver", répond-il. Didier Gaultier, patron de l'IA chez Orange Business Digital Services, explique : "Ces entreprises acquièrent des GPU en masse soit au comptant soit en leasing. C'est ce qui leur permet de casser les prix." Chez Lambda, il faut compter un peu moins de 3 euros de l'heure pour bénéficier d'une carte graphique de type Nvidia H100. "A ce prix-là, c'est cadeau", commente Stéphane Roder. Et Didier Gaultier de réagir : "Les acteurs les plus économiques sont ceux qui affichent le pire bilan carbone. CoreWeave et Lambda figurent parmi les moins bien placés."

La sécurité comme talon d'Achille

Idem pour la confidentialité des données. Les fournisseurs les moins chers sont aussi ceux qui offrent le moins de garanties dans ce domaine. Les hébergements de CoreWeave ou Lambda sont basés aux Etats-Unis ou dans des pays tiers non spécifiés, ce qui engendre une dépendance très forte aux réglementations extraterritoriale de type Cloud Act - qui obligent les sociétés américaines à ouvrir leurs données quelle que soit leur géographie d'hébergement sur simple injonction fédérale. "Ces offres pèchent également en termes de cybersécurité, et notamment de chiffrement", constate Didier Gaultier. "Résultat : ces solutions seront davantage destinées à l'entrainement qu'à l'inférence, qui implique en général la manipulation des données du client. Des informations qui se révèlent par définition plus sensibles."

Reste à savoir si le marché de l'entrainement des modèles est important ? Chez Orange, on a mis en œuvre ce type de projet pour le compte de clients en se basant sur l'infrastructure du groupe. "Dans le cadre de ces projets, le temps de location des GPU correspond à un tiers du coût du chantier. L'entraînement d'un modèle complet implique une grosse part d'ingénierie qui consiste à entraîner le modèle par itération et benchmarks successifs, avec à la clé, à chaque étape, une correction des paramètres de learning", explique Didier Gaultier.

"Face à ces acteurs, les hyperscalers proposent des crédits gratuits pouvant aller jusqu'à plusieurs centaines de milliers de dollars"

Les clouds orientés IA ne sont pas non plus forcément intéressants pour tous les profils de clients, et notamment pour les start-up. "Pour les jeunes pousses, les hyperscalers proposent des crédits gratuits pouvant aller jusqu'à plusieurs centaines de milliers de dollars. Une enveloppe qui peut être allouée à la location de GPU", rappelle Julien Salinas, CTO chez NLP Cloud. Parmi les fournisseurs de cloud français, Scaleway offre des crédits jusqu'à 36 000 euros qui sont éligibles aux GPU les plus puissants de l'hébergeur. Avec ces offres, les acteurs du cloud ont pour objectif de fidéliser les jeunes pousses pour qu'elles adoptent ensuite leur plateforme sur la durée.

L'absence d'offre de service

Autre contrainte, "les pure player du cloud orienté IA ne commercialisent pas d'offres de service", pointe Didier Gaultier chez Orange. Résultat : le client devra se débrouiller seul pour mettre en œuvre son projet d'entraînement et/ou d'inférence.

"Même s'ils affichent des GPU de type H100 à prix cassés et soi-disant disponibles en un clic, vous n'accédez pas forcément à ces offres si facilement. Il faudra montrer patte blanche, présenter son projet, ses antécédents...", prévient de son côté Julien Salinas. Pourquoi cette tendance ? "Le marché des GPU restent tendu, et par conséquent les ressources demeurent relativement rares", explique l'expert. Conclusion : ces acteurs chercheraient avant tout à faire du volume. D'où les contrats pharaoniques signés par CoreWeave avec Microsoft et OpenAI.