Avancées dans la technologie des transceivers : permettre les réseaux à haut débit et l'avenir de l'IA

Comprendre l'évolution des transceivers optiques et des racks de calcul d'intelligence artificielle permet d'anticiper les besoins futurs en matière de câblage structuré.

Je trouve très utile de suivre la feuille de route des transceivers optiques pour comprendre quel type de fibre, combien d'entre eux et quels connecteurs optiques seront utilisés dans la prochaine génération de transceiver optiques afin de prévoir les implications sur le câblage structuré. Ces informations, combinées à la vision de l'évolution des racks de calcul d'intelligence artificielle de la prochaine génération, me donnent des indications sur le nombre de fibres par rack de calcul/réseau que je dois prévoir de déployer dans les nouvelles constructions ou dans la rénovation de l'infrastructure existante.

La conférence et l'Exposition sur la Communication par Fibre Optique (OFC) au début de l'année et la Conférence Européenne sur la Communication Optique (ECOC) vers la fin de l'année sont des moments clés de l'industrie pour ceux qui souhaitent comprendre les tendances existantes et émergentes dans le domaine des communications optiques. Vous trouverez ci-dessous les principales tendances et les faits marquants que j'ai relevés lors de ces événements en 2024. Je souligne ces tendances parce que je m'attends à ce qu'elles se poursuivent en 2025.

L'essor des transceivers de 1,6T

Les transceivers 800G actuellement disponibles sur le marché utilisent des vitesses de 100G/ligne. Ainsi, pour un transceiver 800G utilisant 8 voies - chaque voie nécessitant une paire de fibres optiques pour une communication simultanée en duplex intégral, en émission et en réception - nous avons besoin de 16 fibres.

La plupart des fabricants de transceivers proposent le 800G-SR8, transceiver multimode, en 2x400G-SR4, et le 800G-DR8, transceiver monomode, en 2x400G-DR4 en emballage combo qui a 2xMTP (MPO) connecteurs sur la face avant au lieu d'utiliser un seul port 1xMTP16 (MPO16).

L'utilisation de ports combo se traduit par un radix de commutation plus important, ce qui permet aux architectes réseau de construire des réseaux fat-tree plus vastes, capables de prendre en charge des clusters GPU plus importants.

Apparition des premières conceptions des transceivers à 1,6T

Je visite les halls d'exposition lors de ces grandes conférences industrielles. Au hasard de mes promenades, j'ai remarqué que les premiers transceivers de 1,6 To/s disponibles dans le commerce sont tous proposés dans un emballage SM sous la forme de 2x800G-DR4 (avec deux connecteurs MTP12) ou 2x800G-FR4 (avec deux connecteurs LC) dans un module OSFP (Octal Small Form Factor Pluggable, format octal petit facteur de forme enfichable).


 

39522217.png

Module OSFP 1,6T avec double interface MTP12 

39522218.png

Module OSFP 1,6T avec double interface LC

Le développement des lasers à cavité verticale émettant à la surface (VCSEL), une technologie clé pour la transmission de données à grande vitesse utilisée dans les transceivers multimodes, devrait être achevé en 2025 et la fabrication en série devrait commencer en 2026, mais pour l'instant, la vitesse de 1,6 T a été volée par les transceivers SM.

Progrès vers 400G/Lane et au-delà

Des discussions ont également eu lieu sur les vitesses de 400G/lane lors du salon, et les personnalités influentes du secteur ont prédit que la conception et la qualification des solutions utilisant des vitesses de 400G/lane prendraient plus de temps. La première modulation d'amplitude d'impulsion à quatre niveaux (PAM4 SERDES), utilisée pour la modulation de signaux à grande vitesse, devrait être disponible en 2027, avec un volume de fabrication croissant en 2028. Ainsi, les transceivers capables de supporter des vitesses de 400G/lane seront très probablement disponibles vers la fin de cette décennie.

L'industrie s'accorde à dire que les fabricants de transceivers n'ajouteront des voies supplémentaires que s'il n'est pas possible d'augmenter la vitesse des voies. Si nous ne parvenons pas à atteindre les vitesses de 400G/lane à temps, nous pouvons espérer doubler le nombre de voies des solutions 200G/lane à venir et atteindre 3,2 térabits par seconde en utilisant des connecteurs 2xMTP16 (l'une des options) sur le boîtier du transceiver. Alors que nous nous dirigeons vers 1,6T, le tableau ci-dessous montre quelques-unes des possibilités qui s'offrent à nous.

39522224.png

Progrès dans le conditionnement des transceivers

En ce qui concerne l'emballage des transceivers optiques, il existait deux écoles de pensée concurrentes : l'optique enfichable à entraînement linéaire et l'optique coemballée. Traditionnellement, les optiques enfichables utilisaient un processeur de signal numérique (DSP) à la fois pour l'émission et la réception à l'intérieur du boîtier du transceiver optique, ce qui nécessitait une puissance considérable. 

Les optiques copackagées, connues sous le nom de CPO, grâce à leur intégration étroite avec les circuits intégrés à application spécifique (ASIC) des commutateurs, peuvent utiliser les processeurs de signaux numériques (DSP) des commutateurs sans avoir besoin d'un processeur supplémentaire, et offrent des économies d'énergie significatives par rapport aux optiques enfichables. Avec l'introduction des derniers ASIC de commutation, les fabricants d'optiques enfichables ont réalisé qu'ils pouvaient également se permettre de ne pas utiliser les DSP sur le transceiver, rejoignant ainsi le club des fabricants d'optiques linéaires, mais avec l'avantage de la modularité, de la facilité de test et de la facilité d'entretien.

Il semble que l'équipe CPO soit sur le point de réaliser quelque chose. Bien qu'aucun client à grande échelle n'ait encore adopté les solutions CPO, les attentes sont grandes. Le travail en arrière-plan des fabricants d'équipements actifs se poursuit, et cette solution est considérée comme l'une des innovations les plus prometteuses pour répondre aux multiples besoins des prochains systèmes d'IA.

39522222.png

Optique linéaire enfichable => LPO

39522227.png

Optique copackagée => CPO

Le besoin de vitesses plus élevées : Sous l'impulsion de l'IA

On peut se poser la bonne question : "Nous venons juste de commencer à mettre en œuvre des systèmes 400G, et vous parlez de systèmes 1,6T et 3,2T. Pourquoi se précipiter, Mustafa ? Tout se résume à l'élan créé par l'IA générative, qui est rendue possible par le traitement d'un nombre croissant de données, connu sous le nom de loi d'échelle, à l'aide d'unités de traitement graphique (GPU) très performantes travaillant ensemble dans de grandes grappes, connues sous le nom d'usines d'IA. En 2020, le plus grand modèle de langage (LLM) utilisera environ un demi-milliard de paramètres. Le GPT-4, publié par OpenAI en 2024, aurait comporté 1,6 trillion de paramètres.

Le consensus actuel dans l'industrie est que les modèles deviennent plus intelligents s'ils ingèrent plus de données ; il y aura donc un besoin de plus de puissance de calcul, ce qui signifie que des grappes de centaines de milliers de GPU fonctionnant à la vitesse la plus élevée possible sont essentielles. En outre, les LLM actuels sont des systèmes textuels capables d'imiter des réponses humaines en langage écrit. L'ajout de la voix et de la vidéo augmentera de manière exponentielle la puissance de calcul nécessaire pour fournir une expérience utilisateur transparente avec les futures solutions basées sur l'IA.

Baies AI et connectivité par fibre optique

Une usine d'IA typique du futur proche devrait accueillir 100 000 GPU et consommer de 300 à 400 MW d'énergie. Le principal élément constitutif d'une usine d'IA est le rack de calcul, et la référence principale pour les derniers racks d'IA haute performance est le rack NVIDIA NVL72, qui peut accueillir 72 GPU et 36 CPU (unités centrales de traitement). 

Si nous considérons un réseau non bloquant pour le réseau back-end, qui est le réseau GPU, nous aurons besoin de 72x8=576 fibres si nous utilisons des transceivers SMF (Single-Mode Fiber) 800G-DR4. En suivant la même logique, les CPU devront se connecter au réseau frontal et au réseau de stockage en utilisant 36x8=288 fibres. Au total, 576+288= 864 fibres seront nécessaires par rack d'IA.

Cette première couche de tissu spine-and-leaf est connectée à l'aide de la fibre MM aujourd'hui, mais en raison du ralentissement du développement du VCSEL 200G/lane, nous pourrions assister à un changement de fibre lorsque nous commencerons à voir les premières constructions de systèmes 1,6T.

Évolution de la connectivité par fibre optique pour les baies d'IA de nouvelle génération

Les leaders de l'industrie s'attendent également à ce que les racks d'IA de la prochaine génération hébergent 128 XPU - un acronyme plus générique qui inclut CPU, GPU, FPGA (Field-Programmable Gate Array), ASIC (Application-Specific Integrated Circuit) - avec une charge d'énergie de 400+kW. Cela nécessitera ((128GPU+64CPU) x8f (optique DR4)) =1526 fibres monomodes par rack AI.

Un pod de 512 GPU composé de 4 racks AI nécessitera plus de 6000 fibres au niveau de l'armoire réseau et un cluster de 100k GPU nécessitera 800x1526= 1,2 million de brins de fibres entre le niveau feuille-épine. Nous devrons doubler ce chiffre pour une architecture spin-core à deux niveaux.

L'une des façons d'apporter ces nombres de fibres aux serveurs AI et aux racks de réseau est d'utiliser le tout nouveau Tiny MT Ferrule Connector (TMT), connu sous le nom de connecteur MMC, qui peut terminer 3456 fibres en utilisant 216x ports de connecteur MMC16 dans un espace de rack de 2U. La connectivité des serveurs et des réseaux peut alors être réalisée simplement en utilisant des harnais de connexion MMC vers MTP8/MPO8 à l'intérieur de ces racks.

Les futures solutions de connectivité par fibre optique : Le connecteur MMC

Le connecteur MMC16 semble bien adapté à la prise en charge du 400G d'aujourd'hui, du 800G de demain et des vitesses futures de 1,6T grâce à sa conception à 16 fibres, et à la prise en charge des futurs environnements à fibres extrêmement denses grâce aux futures versions potentielles à 32f par connecteur.
 

39522225.png

Connecteur MMC (REN10876.tif)

39522226.jpg

MMC à brides 

Conclusion

Les conférences sectorielles offrent des occasions précieuses d'apprendre des concurrents, d'obtenir des perspectives multiples et d'extraire des informations clés. Les principales tendances identifiées sont les suivantes 

  • Transceivers next gen : les transceivers 200G/lane sont à l'horizon, les optiques monomodes pouvant arriver avant les multimodes.
  • Optique co-packagée : Les optiques à emboîtement linéaire, comme les optiques coemballées et linéaires, gagnent du terrain, mais les problèmes d'interopérabilité des fournisseurs doivent être résolus.
  • Communication axée sur l'IA : La croissance des modèles d'IA stimule la demande de communication à haut débit dans les grandes usines d'IA.
  • Besoins en fibres pour les baies d'IA : Les racks d'IA actuels comportent 72 GPU, les racks futurs nécessitant environ 1500 fibres par rack et des millions de fibres pour des clusters de 100k GPU. Les connecteurs MMC16 sont une solution viable pour fournir cette densité de fibres.