Comment la SNCF a déployé son propre ChatGPT

La compagnie ferroviaire met en œuvre l'IA générative aussi bien pour le support que pour améliorer la maintenance prédictive de ses trains.

Comptant 250 000 collaborateurs, la SNCF fait rouler 15 000 trains et transporte 5 millions de voyageurs chaque jour. Le groupe s'adosse à un réseau en fibre optique de plus de 20 000 kilomètres maillant toutes ses gares et sites. Une infrastructure numérique qui tend vers l'ultra haut débit (avec des capacités de 20 à 400 gbits par seconde). L'entreprise totalise des teras octets de données manipulées quotidiennement en provenance de ses terminaux et capteurs IoT. "C'est cette infrastructure télécom qui nous a permis de passer à l'ère de l'IA", commente Christophe Fanichet, directeur général adjoint au numérique du groupe SNCF et PDG de SNCF Voyageurs. A cela s'ajoute un data lake en mode muticloud pour fédérer l'ensemble de ces données. "Nous étions par conséquent prêt à passer à l'ère de l'IA générative", souligne Christophe Fanichet.

Comment la SNCF a-t-elle réagi suite à l'avènement de ChatGPT ? Dans un premier temps, elle a laissé l'ensemble des collaborateurs accéder au service sans aucune restriction. Fin 2022, le groupe comptait déjà entre 500 et 2 000 salariés qui y avaient recours chaque jour. Mais très vite, à l'instar de beaucoup d'autres acteurs, la compagnie ferroviaire a décidé de développer un ChatGPT privé. En ligne de mire : protéger ses données sensibles, telles que les plans de transport, les documents de maintenance ou encore les appels d'offres. Baptisé SNCF Group GPT, le nouvel assistant s'adosse à Azure OpenAI. Il est ouvert aux dirigeants et principaux managers de la société. Une prompt académie a été mise en place pour les former à son utilisation.

Un ChatGPT privé

SNCF Group GPT s'articule autour de plusieurs espaces. En premier lieu, un espace documentaire, reposant sur un RAG, une infrastructure regroupant plus de 70 000 documents de référence. La finalité : épauler les cols bleus. "Lors d'une opération de maintenance sur un essieu par exemple, le RAG leur facilite l'accès à l'ensemble des référentiels et toute la documentation technique relative à cette pièce", argue Christophe Fanichet. "Un contenu qui est résumé, mais aussi sourcé." Objectif : sécuriser les opérations, sachant que les trains doivent évidemment être d'une grande fiabilité.

Un deuxième espace permet aux collaborateurs d'injecter leurs propres documents dans le chatbot. La finalité ? Accélérer les tâches répétitives des cols blancs. "On reçoit beaucoup d'appels d'offres par exemple. Partant de là, on a besoin de disposer de contenus de synthèse, voire de prémacher et d'affecter des tâches aux collaborateurs, du juridique jusqu'aux achats en passant par la maintenance ou les équipes commerciales", détaille Christophe Fanichet.

Aujourd'hui, plus de 2 500 collaborateurs ont recours à ce ChatGPT privé quotidiennement. La SNCF compte monter à 6 500 cet été et à 10 000 à la fin de l'année. En parallèle, l'entreprise a développé un outil de traduction qu'il compte, à terme, mettre entre les mains de plus de 50 000 collaborateurs. Baptisé Trad SNCF, il couvre plus de 130 langues. Une solution également basée sur Azure OpenAI.

Aux côtés de ces projets, la SNCF planche sur des chantiers plus industriels en lien avec la start-up française Mistral. Le premier d'entre eux consiste à améliorer l'information aux voyageurs en situation perturbée. "Nous avons un train sur 10 qui n'arrive pas à l'heure", rappelle Christophe Fanichet. "Nous comptons sur le LLM de Mistral pour améliorer la prévisibilité du rétablissement d'un réseau." Rupture de caténaire, aiguillage en difficulté, gare saturée... Ici, le LLM permettrait de trouver des solutions en se basant sur un historique de milliers de cas d'usage en vue de délivrer la bonne information à l'usager. Prenons l'exemple d'un incident de personnes. En moyenne, la SNCF estime dans ce cas la durée de rétablissement à 2h30 en moyenne. "Demain avec l'IA générative, on pourra prendre en compte les multiples critères qui peuvent avoir un impact sur le temps de remise en route : condition météo, lieu isolé ou non... L'idée étant d'affiner au maximum l'estimation", explique Christophe Fanichet.

"Si un défaut oblige à interrompre une circulation, ce n'est évidemment pas la machine qui va prendre la décision"

Parmi les autres cas d'usage à l'étude où l'IA générative pourrait intervenir figurent l'optimisation des plans de transport ou encore celle des pas de maintenance (c'est-à-dire la fréquence de maintenance des trains). "Ici, la GenAI aidera à concevoir une solution et/ou différentes alternatives", argue Christophe Fanichet.

Un voice bot pour mieux informer

En sortie de ses ateliers, la SNCF s'adosse par ailleurs à l'IA générative pour analyser les photos de ses infrastructures ferroviaires. Objectif du groupe : détecter les défauts potentiels sur ses trains, et exprimer en bout de course les problèmes en question en vue de dénicher les solutions correspondantes. L'humain restant le seul juge de la décision à prendre ensuite. "Si un défaut oblige à interrompre une circulation, ce n'est évidemment pas la machine qui va prendre la décision", insiste Christophe Fanichet.

Autre projet : plancher sur un voice bot qui permettra d'échanger en langage naturel via la ligne téléphonique d'informations de la SNCF (le 3635). Et ce, sans avoir à se déplacer dans un menu en tapant sur les touches de l'appareil. Les agents qui répondent au téléphone en bout de course pourront également s'adosser à l'IA générative pour fournir une meilleure information. Idem sur SNCF Connect. La SNCF compte développer un assistant d'IA générative sur son espace de réservation en ligne. Mais ce service comptant plus d'1 milliard de visites par an, le groupe préfère prendre son temps avant de le déployer.