Libérer le potentiel des entreprises grâce à la voix

Le CES 2019 fut encore riche en innovations. Bien que la plupart des produits mis en avant soient grand public, les technologies présentées constituent aussi des opportunités pour les pros. Prenons l’exemple des assistants vocaux et enceintes connectées.

Parler a toujours été notre moyen de communication le plus naturel. Les conversations sont personnelles et apportent des éléments de contexte qui facilitent la compréhension mutuelle des interlocuteurs. Ces échanges se poursuivent au fil du temps, développant un historique qui ne cesse d’enrichir le contexte. Jusqu’à récemment, l’incapacité de la technologie à traiter une vraie conversation humaine représentait un véritable challenge.

Les interfaces de nos outils numériques ont toujours été déterminées par les capacités de nos systèmes informatiques : claviers, souris, interfaces graphiques, télécommandes et écrans tactiles. Le tactile a facilité les choses : il suffit maintenant de toucher un écran pour faire apparaître l’application souhaitée. Mais l’option du tactile n’est pas toujours possible, ou parfois peu pratique. La multiplication des applications rarement, voire jamais, utilisées empêche une expérience réellement fluide et orientée client qui permettrait d’intégrer nos systèmes numériques à nos vies « analogiques ».

La voix change la donne

Notre voix est un moyen de communication puissant car spontané et intuitif. Elle permet d’interagir avec la technologie de la façon la plus naturelle qui soit, ce qui explique qu’elle soit probablement l’interface utilisateur la plus universelle. En effet, en utilisant sa voix, pas besoin de s’adapter ou d’apprendre la logique d’une nouvelle interface utilisateur. Ainsi, il n’est pas nécessaire de différencier les fonctionnalités vocales selon chaque application ni de de trouver une application spécifique pour accomplir une tâche donnée.

Il y a encore deux ou trois ans, nous ne disposions pas des capacités nécessaires pour traiter la voix à grande échelle et en temps réel. Le traitement vocal à grande échelle est désormais une réalité pour plusieurs raisons, à savoir l’important volume de données vocales d’apprentissage disponibles, les avancées réalisées en matière de logiciels avec des moteurs de traitement tels que Caffe, MXNet et Tensorflow, et l’essor de moteurs de traitement massivement parallèle permettant un accès mémoire à faible latence.

Aujourd’hui, les cas d’usage du « pouvoir de la voix » concernent le plus souvent la domotique ou les trajets en voiture, pour écouter de la musique, faire des achats, contrôler les installations connectées de son domicile ou encore trouver son itinéraire. Toutes ces fonctionnalités sont rendues possibles par l’intelligence des assistants vocaux qui repose sur une plateforme de traitement du langage naturel, elle-même fondée sur des algorithmes de machine learning. Ainsi, les assistants vocaux ne cessent d’apprendre et disposent désormais de dizaines de milliers de compétences, dépassant à l’heure actuelle le simple cadre de la vie quotidienne. En misant sur l’utilisation de la voix par tous, un nombre encore plus important de scénarios peuvent notamment voir le jour dans un cadre professionnel.

Aider davantage d’entreprises à utiliser la voix

Au travail, les personnes interagissent avec une multitude d’applications et de systèmes. Pourquoi ne pas utiliser les interfaces vocales pour déclencher tous ces scénarios d’utilisation ? L’un des obstacles tient dans la difficulté de gérer des interactions et des dispositifs contrôlés par la voix à grande échelle. En effet, trois éléments sont indispensables pour utiliser la voix dans un contexte professionnel. Le premier est une couche de gestion, le second est un ensemble d’API à intégrer à vos applications et infrastructure informatiques, et le troisième consiste à s’équiper de dispositifs compatibles avec la voix.

Les interfaces vocales représentent une véritable révolution, et il est crucial de faciliter l’intégration des capacités vocales à un maximum d’appareils. Ces nouveaux outils doivent également permettre aux entreprises et aux développeurs de créer des compétences spécifiques pour les tâches qui les intéressent et même d’en réserver l’accès à leurs seuls collaborateurs s’ils le souhaitent. Par exemple, certaines entreprises permettent à leurs employés d’effectuer toutes sortes d’opérations par l’intermédiaire de commandes vocales, comme accéder à des briefings internes ou demander à quelle heure ferme leur service informatique.

Des espaces gérés par la voix

Tout comme un assistant vocal facilite la gestion d’une maison connectée, les mêmes fonctionnalités peuvent être utilisées au travail. Un assistant vocal peut servir à contrôler son environnement,  réserver une chambre d’hôtel, signaler un problème ou trouver un moyen de transport. L’une des plus importantes applications de la voix au sein d’une entreprise concerne la gestion des salles de conférence. Il est donc possible d’élaborer des compétences spécifiques qui permettent d’améliorer la productivité dans ce domaine.

Par exemple, de nombreuses réunions ne démarrent généralement pas à l’heure. Il est souvent difficile de trouver les informations de connexion, de saisir les numéros et le code demandés chaque fois qu’une réunion démarre. Avec un assistant intelligent professionnel, l’administrateur peut configurer les salles de conférence et intégrer des calendriers aux appareils. Pour lancer une réunion, il suffit de lui demander : "Démarre ma réunion". Il détectera automatiquement de quelle réunion il s’agit grâce à son calendrier intégré, saisira les informations d’accès, se connectera au système de téléconférence et démarrera la réunion. L’outil pourra abaisser automatiquement l’écran du projecteur, tamiser la lumière, etc. Les personnes en télétravail pourront également automatiquement se connecter à la réunion inscrite dans leur calendrier.

Applications à commande vocale

Les interfaces vocales prendront réellement leur essor lorsqu’un plus grand nombre d’applications activables par la voix verront le jour. Aujourd’hui, les assistants vocaux peuvent interagir avec un grand nombre d’applications d’entreprise. Les développeurs informatiques qui souhaitent exploiter les interfaces vocales peuvent « habiliter » leurs applications personnalisées et mettre ces compétences à la disposition exclusive de leur organisation. Un certain nombre d’agences et d’intégrateurs systèmes peuvent apporter leur aide sur ce point, et il existe des référentiels de code proposant des exemples.

Nous assistons à l’émergence de nombreux scénarios d’utilisation très intéressants reposant sur les assistants vocaux, au sein d’entreprises aux profils très variés. WeWork, un fournisseur d’espaces de travail partagés et de services associés, a adopté un assistant vocal en l’intégrant à ses opérations quotidiennes. L’entreprise a élaboré des compétences privées que les employés peuvent utiliser pour réserver des salles de conférence, soumettre des tickets d’assistance au support technique et obtenir des informations sur la disponibilité des salles de réunion.

Ainsi, la prochaine génération de systèmes et d’applications professionnelles se construira sur des interfaces conversationnelles, et nous voyons déjà ce phénomène prendre de l’ampleur.