Sesterce, un cloud français orienté IA à l'assaut de CoreWeave et Lambda

Sesterce, un cloud français orienté IA à l'assaut de CoreWeave et Lambda Sesterce est le seul cloud français orienté IA spécialisé à 100% dans les GPU. Il entend faire jeu égal avec les géants américain du secteur.

Positionné à la fois sur l'entrainement et l'inférence de grands modèles d'IA, le français Sesterce fait des GPU sa marque de fabrique. Son positionnement consiste à acquérir des volumes massifs de cartes graphiques pour les louer ensuite à bas coûts. Sa politique tarifaire est particulièrement agressive, Sesterce proposant un GPU de type H100 à partir de 1,7 dollar de l'heure. Un tarif défiant toute concurrence qui lui permet d'affronter les géants du secteur que sont les américains CoreWeave et Lambda, dont le pricing est bien plus élevé. Fort de quelque cent salariés, Sesterce, dont la R&D est basée en France, revendique près de 600 clients actifs. 

Parmi ses clients, Sesterce compte des laboratoires en IA mais aussi des hyperscalers en quête de GPU à bas coûts. De grandes entreprises, de niveau CAC40, utilisent aussi ses services pour entraîner et exécuter des modèles. Côté référence, Sesterce travaille notamment main dans la main aux Etats-Unis avec SF Compute, un autre fournisseur de GPU à bas coûts. En Europe, il collabore avec la start-up FlexAI qui propose un PaaS orienté IA.

De l'entrainement à l'inférence

En termes de cas d'usage, Sesterce est particulièrement centré sur l'entrainement de grands modèles. "Aux côtés de la robotique, nous nous frottons à des cas d'usage plus classiques : assistants de productivité, reporting ou encore support client. Sur des sujets plus pointus, nos infrastructures sont aussi utilisées dans la simulation, la recherche biomédicale et pharmaceutique ou encore les véhicules autonomes. Les cas d'usage sont sans fin", égraine Youssef El Manssouri, CEO de Sesterce.

Pour l'heure, la société est en train de développer un datacenter de 40 mégawatts basé à Valence dans la Drôme. Une infrastructure présentée comme un site pilote. A moyen terme, Sesterce prévoit de bâtir à Gardanne (dans les Bouches-du-Rhône) un data center à hauteur de 1 gigawatt à horizon 2030. Total de l'investissement : 52 milliards d'euros. Cette enveloppe se répartira entre 10 milliards d'euros pour le financement de l'infrastructure de base, et 42 milliards d'euros pour l'acquisition de GPU de dernière génération. "Nous avons constitué un consortium international d'acteurs pour porter la première tranche de financement du projet. Il s'agit de fonds mais également d'acteurs des centres de données. Ils sont à la fois européens et américains", confie Youssef El Manssouri, qui reste discret sur le sujet.

"Beaucoup de nos clients sont attirés par les économies d'échelle que nous allons pouvoir atteindre"

La seconde tranche du projet sera financée par des clients, notamment des hyperscalers et des acteurs de l'univers télécom. "Beaucoup de nos clients sont attirés par les économies d'échelle que nous allons pouvoir atteindre avec un projet de cette taille", souligne Youssef El Manssouri. Au total, l'entreprise compte déployer pas moins de 1,2 million de GPU sur le site d'ici cinq ans.

France, Etats-Unis, Canada, Allemagne, Danemark, Finlande, Islande, Inde, Singapour... Sesterce a déjà déployé de multiples régions cloud en partenariat avec des fournisseurs de datacenters comme Equinix ou Digital Realty. "Pour l'heure, ces infrastructures sont globalement de petite taille et principalement axées sur l'inférence de modèles", explique Youssef El Manssouri. "A plus long terme, notre vision consiste à installer un hub de 1 gigawatt par grande plaque géographique, à savoir l'Europe, région par laquelle nous commençons, l'Asie et l'Amérique." Sesterce entend atteindre des puissances de 100 à 200 mégawatts d'ici 3 ans puis près de 500 mégawatts à 1 gigawatt d'ici 5 ans pour chacun de ces sites.

156 milliards d'euros d'investissement

Quid des GPU ciblés par Sesterce ? La société compte suivre la feuille de route de Nvidia. Dans un premier temps, elle déploiera des cartes graphiques H100 et H200, puis des GPU de la génération Blackwell au premier rang desquels les B200. Ce sont précisément ces GPU que Sesterce entend mettre en œuvre au sein de ses hubs mondiaux. Des cartes graphiques tarifés à 33 000 euros l'unité. En répliquant les 1,2 million de GPU prévus au sein de son infrastructure de Gardanne, le total pourrait représenter à terme un investissement global de 126 milliards d'euros, auxquels s'ajoutent les 30 milliards prévus pour déployer les infrastructures de base des datacenters. Pour orchestrer ces unités de calcul, l'acteur compte sur l'architecture Nvidia GB200 taillée pour connecter 36 CPU Grace et 72 GPU Blackwell via un modèle rackable à refroidissement liquide.

En parallèle, Sesterce positionne ses infrastructures européennes sur le créneau des clouds souverains. La société vise la certification SecNumCloud sur ses datacenters français. En parallèle, elle améliore son moteur d'inférence et œuvre à ajouter à son cloud des services de stockage de données. Une brique indispensable pour entraîner des modèles. Comparé à CoreWeave, dont l'infrastructure repose nativement sur Kubernetes, Sesterce se veut plus flexible. L'acteur n'impose pas de stack logiciel, mais entend s'adapter aux choix de ses clients.