Comment la 6G et l'IA vont permettre une nouvelle ère de communications immersives

Alors que les frontières entre les mondes numérique, humain et physique s'estompent, l'IA et la 6G de nouvelle génération sont appelées à jouer un rôle clé dans le développement de la réalité étendue.

Le potentiel de la communication immersive 6G dans des domaines tels que la télémédecine, le divertissement et la formation a été largement discuté. Mais comment cette nouvelle ère de détection des communications sans fil, rendue possible par l'intelligence artificielle (IA), permettra-t-elle exactement la continuité entre les mondes numérique, humain et physique ? Examinons de plus près comment la 6G, l'IA et la technologie de détection s'y prendront.

Passer de la 5G à la 6G

Aujourd'hui, les réseaux privés 5G révolutionnent déjà la chirurgie grâce à des applications de réalité mixte. Ces logiciels transforment les images de tomodensitométrie (CT scan) ou d'imagerie par résonance magnétique (IRM) de tumeurs ou d'occlusions vasculaires en hologrammes 3D détaillés. Ces hologrammes peuvent être manipulés (agrandis, réduits, déplacés) et même superposés directement sur le patient. Ces fonctionnalités améliorent la précision de la planification chirurgicale, ce qui peut réduire le temps d'anesthésie et accélérer la convalescence du patient.

La 5G facilite des simulations de formation immersives pour les services d'urgence. Par exemple, elle permet aux policiers de s'exercer à la gestion de conflits avec des suspects armés. Elle connecte également les ambulanciers à des cliniciens à distance, qui peuvent les guider lors de procédures de sauvetage critiques en route vers l'hôpital. Depuis 2024, la téléchirurgie fait les gros titres, permettant à des chirurgiens d'opérer des patients situés à des milliers de kilomètres grâce aux réseaux 5G.

Bien que la 5G rende déjà possible ces expériences novatrices, les chercheurs explorent la 6G et l'IA afin de dépasser les limites actuelles de la 5G.

1. Très faible latence et haute fiabilité pour l'haptique en temps réel et la réalité étendue (XR)

La 6G vise une latence inférieure à la milliseconde et une fiabilité quasi parfaite, permettant un retour haptique en temps réel, des expériences tactiles à distance et des interactions de réalité étendue plus réalistes. L'IA peut optimiser dynamiquement les performances du réseau pour maintenir la qualité dans des conditions variables.

Alors que le réseau d'accès radio (RAN) et le calcul en périphérie multi-accès (MEC) aident à rapprocher la latence de la 5G de son objectif de 1 ms, les implémentations actuelles de la 5G se situent généralement entre 1 et 10 ms. Les développeurs de l'internet tactile des objets et de la robotique autonome cherchent à obtenir une latence inférieure à zéro avec la 6G, afin d'éliminer les problèmes de gigue et de pertes de trames de la 5G qui dégradent l'expérience utilisateur.

La latence ultra-faible de la 6G permettra de suivre des mouvements subtils avec une précision millimétrique, de partager ces données de mouvement avec des systèmes haptiques et d'offrir des expériences immersives plus réactives et raffinées (voir la figure 3).

L'intégration de l'IA dans les futurs réseaux 6G est essentielle pour un retour haptique ultra-réactif. L'IA prédira l'intention de l'utilisateur, optimisera l'acheminement du signal et minimisera la latence grâce à l'informatique en périphérie. La recherche sur les modèles d'apprentissage automatique démontre que la compression et l'encodage dynamiquement ajustés des données tactiles garantiront des sensations tactiles de haute fidélité en temps réel.

2. Largeurs de bande massives pour la prise en charge des médias multisensoriels

Ces dernières années, le terme « mulsemedia », contraction de « multi-sensorial media », a gagné en importance. Il décrit la numérisation des odeurs et des goûts, permettant aux communications immersives de dépasser la simple stimulation des sens audio, visuel et tactile dans le monde numérique. Imaginez un réveil dans le métavers, où un service de parfums à la demande imprègne votre intérieur d'une brise légère et des arômes de café ou de pain fraîchement cuit, sans les calories associées.

Pour des expériences immersives, la synchronisation en temps réel de multiples entrées sensorielles est essentielle. Les applications tactiles, par exemple, requièrent des fréquences de rafraîchissement supérieures à 1 kHz (soit des mises à jour toutes les millisecondes) pour un retour haptique instantané. Bien que la 5G soit capable de supporter de telles fréquences, maintenir cette performance de manière constante pour plusieurs utilisateurs et dans des conditions de réseau variables demeure un défi.

Les recherches actuelles, axées sur l'évolution de la 5G (B5G) vers la 6G, explorent l'utilisation des fréquences térahertz (THz) et d'une bande passante massive. L'objectif est de prendre en charge des données multisensorielles (audio spatial, odorat, toucher) en temps réel. L'IA joue un rôle crucial en compressant, reconstruisant et personnalisant ces flux pour créer des environnements virtuels immersifs.

Pour valider l'intégration de la 6G et de l'IA, de nouveaux bancs d'essai de recherche sont nécessaires. Cette démarche vise à surmonter les défis actuels de la 5G et de la B5G, notamment les débits de données limités, les contraintes de latence, le gaspillage énergétique et l'utilisation inefficace du spectre. La demande massive de bande passante par les données multisensorielles rend indispensable l'apprentissage automatique pour traiter et interpréter de grands volumes d'entrées sensorielles, afin d'affiner les réponses haptiques.

De plus, l'IA peut jouer un rôle crucial dans la résolution du problème des données manquantes dans les applications multisensorielles de la 6G. Les techniques d'IA avancées, notamment l'IA générative et l'apprentissage automatique, peuvent être employées pour estimer ou synthétiser les points de données manquants, ce qui améliore considérablement la robustesse et la précision du traitement des données multisensorielles au sein des réseaux 6G.

3. Communications contextuelles et intelligentes

À l'ère future où la science rencontre la sensibilité, l'IA en 6G permettra de mettre en place des systèmes de communication adaptatifs et sensibles au contexte : des réseaux et des algorithmes intégrés à un bot Android, capables de comprendre les intentions, les émotions et l'environnement de l'utilisateur humain. Autre scénario tout à fait plausible : imaginez enfiler une veste holographique dotée de 100 000 capteurs et d'une technologie haptique. Cette projection holographique en temps réel peut combler le temps et la distance, permettant à un père travaillant à l'étranger de tenir et de toucher le jumeau numérique holographique de son nouveau-né, ou à un membre de la famille éloigné de faire ses adieux à un proche en fin de vie.

Actuellement, la technologie 5G reste largement indépendante du contenu et manque d'intégration poussée de l'IA en périphérie. Par conséquent, elle ne peut pas ajuster dynamiquement la qualité de l'expérience en fonction du contexte utilisateur humain, ce qui entraîne des performances non optimisées dans les scénarios immersifs complexes. Dans les communications immersives comme l'holographie, outre une bande passante et des capacités de chargement de données élevées, une latence ultra-faible de 0,1 ms et une précision de positionnement sont importantes (voir tableau 1). La 5G avancée actuelle offre une précision de positionnement optimale de 0,3 m, tandis que celle de la 6G est d'environ 1 cm. L'objectif est d'atteindre une précision millimétrique, essentielle pour les applications de robotisation et d'holographie spatialement sensibles, comme la téléchirurgie.

La création de jumeaux numériques holographiques nécessite la cartographie et la prédiction en temps réel des états des entités du monde humain, ainsi que la reproduction d'informations spatiales tridimensionnelles. L'IA jouera un rôle crucial dans la couche d'intelligence des jumeaux numériques holographiques générés grâce à la détection et aux communications intégrées (ISAC). L'IA permettra la fusion de données, la super-résolution et la modélisation prédictive.

Les capacités d'apprentissage profond de l'IA piloteront divers modèles, des réseaux neuronaux convolutifs (CNN) aux réseaux convolutifs de graphes (GCN), en passant par les transformateurs, pour extraire des informations de la vaste quantité de données de capteurs. Cela permettra le traitement et l'intégration de données de détection multi-nœuds (par exemple, nuages de points et échos radio), améliorant ainsi la résolution des modèles environnementaux et comblant les lacunes de données. Cette couche exécute également la compression sémantique et l'apprentissage fédéré pour transmettre efficacement et affiner en continu les modèles holographiques, garantissant ainsi des répliques numériques haute précision et en temps réel du monde physique [8].