Nvidia lancera sa nouvelle puce pour l'IA générative fin 2026

Dévoilée lors du salon AI Infra Summit, la puce Rubin CPX sortira fin 2026. Elle vise à améliorer les performances des intelligences artificielles.

Le fabricant américain Nvidia continue d'innover dans le domaine des puces pour l'intelligence artificielle. Sa nouvelle puce Rubin CPX, présentée en septembre 2025, sera disponible fin 2026. L'objectif est clair : répondre à la demande croissante de puissance de calcul pour les IA, notamment celles capables de raisonner sur plusieurs étapes.

Une puce conçue pour l'inférence IA

Rubin CPX est une puce spécialement conçue pour l'inférence, c'est-à-dire l'utilisation d'un modèle IA déjà entraîné. Selon LeMagIT, elle atteint une puissance de 30 pétaFLOPS en 4 bits. Contrairement aux modèles précédents, elle ne contient pas de mémoire HBM, mais utilise 128 Go de mémoire GDDR7, plus simple et moins coûteuse. Cette configuration permet d'intégrer une plus grande variété de circuits spécialisés.

Elle prend en charge l'encodage des requêtes utilisateurs, le traitement des données via RAG (retrieval-augmented generation), ainsi que le codage vectoriel d'images et de vidéos. Cette combinaison permet d'utiliser une mémoire unifiée, ce qui réduit les besoins en RAM pour les modèles gérés, y compris ceux comptant jusqu'à 100 milliards de paramètres encodés en 8 bits.

Vers des serveurs encore plus puissants

Rubin CPX s'accompagnera d'autres composants comme le GPU Rubin (dédié à l'entraînement des modèles) et le processeur ARM Vera (successeur du Grace). L'ensemble de ces puces formera le coeur des futurs serveurs MGX, présentés comme 7,5 fois plus puissants que les actuels DGX GB300. Selon Le Figaro, un serveur MGX pourra regrouper jusqu'à 144 GPU Rubin et 72 processeurs Vera, cumulant 150 To de mémoire HBM. Les connexions seront assurées par des switches Spectrum6 et des cartes réseau ConnectX-9, permettant des débits allant jusqu'à 1600 Gbit/s par port.

Le modèle haut de gamme, appelé Vera Rubin NVL144 CPX, offrirait des performances équivalentes à 7,5 fois celles du serveur GB300 NVL72 de la gamme Blackwell, commercialisé fin 2024. D'après Nvidia, ces serveurs pourraient générer un retour sur investissement de 5 milliards de dollars pour 100 millions d'euros d'achats.

Le PDG de Nvidia, Jensen Huang, avait évoqué cette puce pour la première fois en juin 2024, sans dévoiler de date de lancement ni de caractéristiques techniques. La Rubin rend hommage à l'astronome américaine Vera Rubin, connue pour ses travaux sur la matière noire, une référence à la puissance invisible que cherche à capturer cette nouvelle génération de puces.