Benoît Bouffart (Voyages-sncf.com) "Créer un skill Alexa est une démarche qui s'inscrit dans le temps"

En 2016, Voyages-sncf.com a développé une application pour l'assistant vocal d'Amazon. Retour d'expérience avec le directeur produits et innovation de la filiale.

JDN. Pourquoi avez-vous créé un skill sur Alexa ?

Benoît Bouffart est le directeur produits et innovation de la filiale. © Voyages-sncf.com

Benoît Bouffart. Voyages-sncf.com attire plus de 12 millions de visiteurs uniques par mois. Notre objectif est de mettre à disposition de nos voyageurs toutes les technologies disponibles en gardant une navigation la plus intuitive possible. En 2014, nous avons lancé un bot sur Twitter pour chercher un billet de train en 140 signes. Fin 2015, nous avons intégré la commande vocale à notre appli mobile. En 2016, nous avons créé un skill pour Alexa, l'assistant personnel d'Amazon, qui permet aux usagers de commander un billet de train par la voix... Nous devions expérimenter cette piste.

Votre skill reste encore limité. Par exemple, il ne permet pas de prendre de billets en groupe ou les remises tarifaires…

Certaines combinatoires demeurent très complexes à gérer comme un achat vocal pour deux adultes, avec un enfant de moins de trois ans et un adolescent en carte jeune. Alors on commence par le plus simple : un voyageur seul sans remise tarifaire. Notre démarche se veut progressive. Ce skill est une pure expérimentation sous la forme d'un proof of concept. C'est-à-dire une version limitée qui nous permet de perfectionner le service au fil des semaines grâce aux différents retours d'expériences recueillis auprès de nos clients. Nous avions également procédé ainsi pour développer notre site internet avec des trajets Paris-Lille en aller simple sans réduction. Puis c'est l'extension à l'ensemble du réseau. Idem pour nos bots sur Messenger uniquement accessibles à destination d'une vingtaine de villes en France. Créer un skill pour Alexa est une démarche qui s'inscrit aussi dans le temps.

"En avril 2017, nous avons créé une équipe de 9 personnes dédiée au conversationnel textuel et vocal"

Quelle est votre stratégie autour du conversationnel ?

On essaye d'être présent sur tous les points de contact pour construire l'e-tourisme de demain. Ce n'est pas la peine de développer à 100% un projet s'il intéresse peu les utilisateurs. Alexa n'est pas encore disponible en Français. Voilà pourquoi nous avons arrêté d'enrichir ce skill pour l'instant. Au départ, nous travaillions sur Cortana, aujourd'hui, nous préférons nous concentrer sur les chatbot de Messenger. Et demain, le groupe innovera plutôt sur Google Home, l'assistant vocal de Google, qui devrait arriver en France avant celui d'Amazon. Nous nous adaptons aux évolutions du marché.

Combien avez-vous investi sur les assistants vocaux ?

En avril 2017, nous avons décidé de créer une équipe de 9 personnes dédiée au conversationnel textuel et vocal. Cette équipe est composée de data scientists, de testeurs et d'UX designers. Je ne peux pas vous communiquer combien nous dépensons précisément sur ce poste. Alexa s'inscrit dans un mouvement global de 340 personnes et d'un budget de 10 millions d'euros dédié à l'innovation chez Voyages-sncf.com.

Quelles difficultés avez-vous rencontré pour développer votre skill ?

L'assistant se heurte eux erreurs de prononciation. Ce qui explique la nécessité de retirer les parasitages et les bruits de fond. Par ailleurs, Alexa, Siri ou Google Home sont anglo-centrés. C'est un problème quand l'utilisateur souhaite se rendre à Nice… pour des raisons phonétiques ! Une autre difficulté consiste à repérer toutes les intentions d'un utilisateur. Par exemple, un client dit : "je veux aller à Marseille demain". L'intelligence artificielle doit alors remplir un formulaire à la place de l'humain. "Demain" se traduit par une date du calendrier. "Marseille", c'est la destination. Si le client change d'avis et dit : "non, finalement, je veux partir en Bretagne". Alexa doit alors comprendre que ceci vaut annulation de l'ancienne commande. Il faut entraîner le skill et corriger les intentions incomprises pour gagner en autonomie, comme avec un enfant. C'est-à-dire, développer des algorithmes afin de récupérer des requêtes non structurées.

Comment fonctionne Alexa en termes technologique ?

"Nos deux data centers traitent 100 terra octets de données par mois"

La technologie d'un skill repose sur deux briques. D'un côté, il y a le speech to text. C'est ce qui transforme la voix de l'utilisateur en texte. Sur Alexa, c'est Amazon qui prend en charge cette dimension. On ne s'interdit pas de le faire un jour, mais il faut disposer d'une certaine force de frappe. D'un autre côté, il y a le natural langage processing (NLP) qui traduit une phrase écrite en intention et génère une requête. Voyages-sncf.com travaille uniquement sur la deuxième brique.

Hébergez-vous ce skill en interne ou passez-vous par le cloud d'Amazon ?

Au début, nous sommes passés par Amazon Web Services. C'était plus simple et plus rapide. Mais aujourd'hui, nous utilisons une solution d'hébergement en propre. Voyages-sncf dispose de deux data centers. Ces derniers traitent 100 terra octets de données par mois. On sait faire du débordement de cloud en cas de pics d'audience. Nous avons beaucoup de compétences en interne utilisables pour les assistants personnels. Grâce au développement de l'application et du site Voyages-sncf.com, nos données sont déjà structurées.

La certification d'Amazon est-elle difficile à obtenir ?

Amazon veut des acteurs majeurs et des services de qualité pour éviter de décevoir les utilisateurs. Voilà pourquoi la certification n'est pas facile. Cela me rappelle le cahier des charges au début de l'App Store d'Apple. Il fallait plusieurs semaines pour qu'une appli sur iOS soit acceptée. Aujourd'hui c'est beaucoup plus rapide. Ce sera la même chose pour Alexa selon moi.

