Solutions vocales embarquées et connectées : les meilleures ennemies

La démocratisation des solutions vocales se heurte à un élément essentiel : la défiance des utilisateurs face à l'exploitation de leurs données. L'avenir de l'interface vocale passe par des solutions embarquées ou mixtes, qui réconcilient sécurisation des données, protection de la vie privée et performance de la reconnaissance vocale.

Siri, Google Now, Alexa, Echo, Cortana, Home, les assistants vocaux investissent notre quotidien, à travers trois types d’usages : des services applicatifs, pour commander un objet ou réaliser une recherche sur Internet ; des usages bureautiques pour consulter son agenda par exemple ; ou encore des applications domotique pour commander par la voix les appareils connectés de son domicile. Demain, les assistants vocaux pourraient faciliter la consultation du trafic du métro en temps réel dans les arrêts de bus RATP ou encore simplifier la recherche de produits en magasin via des applications d'aide. La promesse ? Fluidifier et accélérer les échanges entre la machine et son utilisateur.

Un marché en pleine expansion et un enjeu pour les marques

Le marché des assistants vocaux vit ses plus belles heures, avec des croissances annuelles estimées à 40% environ, jusqu’à représenter environ 7 milliards € à horizon 2023… c’est-à-dire demain. En France, en 2019, 29% des internautes de plus de 15 ans avaient déjà recours à l’assistant vocal de leur smartphone, de leur tablette ou de leur ordinateur, selon Médiamétrie. Cela représente de 16 à 20 millions d’utilisateurs. Dans le monde, on estime à 3 milliards le nombre d’assistants vocaux, sur l’ensemble des supports, avec une projection à 8 milliards pour 2023, selon le cabinet Roland Berger. Alors que la voix s’affirme comme l’interface homme-machine de prédilection pour les années à venir, quelle stratégie adopter au moment d’intégrer un assistant vocal ?

Un assistant vocal est une application logicielle qui permet, grâce à des technologies embarquées de reconnaissance automatique de la parole, de traitement et de compréhension du langage naturel ou encore de biométrie, de répondre à des sollicitations vocales de son utilisateur. A proprement parler, un assistant vocal n’est pas intelligent : il embarque avec lui une typologie d’informations qui lui permet de répondre à un ensemble de requêtes sous la forme du "dialogue". La qualité des technologies intégrées pour rendre cet assistant vocal performant est un des premiers critères à prendre en compte, mais il n’est pas le seul.

Le manque de transparence sur l’usage des données collectées par les solutions cloud

L’assistant vocal peut être connecté au cloud, être embarqué dans un produit, ou profiter des deux mondes dans un modèle d’hybridation.

Les solutions connectées au cloud sont privilégiées par les "grands" acteurs de ce marché, de Google à Microsoft en passant par Apple, ou encore les fabricants de smartphones, d’enceintes, de téléviseurs, etc. Celles-ci intègrent donc une intelligence artificielle, qui permet à la solution d’évoluer et de se perfectionner. Cette IA exploite les données collectées à travers les requêtes utilisateurs par l’écoute et l’identification des mots clés et des demandes. Tant qu’il s’agit d’œuvrer à une amélioration continue du service, difficile d’y trouver à redire. Mais cette collecte vise essentiellement à apporter des informations pour définir un profil utilisateur en analysant ses différentes interactions : habitudes de vie, de consommation, emploi du temps, achats passés, centres d’intérêts, etc.

Cette donnée est d’abord un aimant commercial pour délivrer des expériences utilisateurs personnalisées. Comprendre : de la publicité ciblée et des offres produits / services qui répondent aux "attentes", aux besoins des utilisateurs. Du moins, tels qu’ils sont perçus par la marque, dans une démarche marketing prédictive. Seul hic : le bénéfice business repose sur l’incapacité de l’utilisateur à contrôler ce qui sera fait de ses données. Pas plus que d’empêcher que ses conversations, ses requêtes, son usage ne soient pistés, parfois à son insu, malgré le RGPD. Cela pose question en termes de protection de la vie privée, de sécurisation des informations et de libre circulation des données. Ces solutions ont pour elles une flexibilité pour améliorer la qualité de service, mais posent questions quant à la protection de la vie privée et des données sensibles, comme les informations bancaires.

Combiner respect de la vie privée et performance

Les solutions embarquées, donc non connectées, s’imposent comme une réelle alternative. Elles présentent en effet certains atouts :

  • elles apportent une totale sécurisation des données, qui ne peuvent donc pas être collectées.
  • non connectées, ces solutions sont moins facilement piratables et réduisent donc les risques ;
  • elles tirent profit de la puissance de calcul des microprocesseurs actuels, qui n’ont pas besoin du cloud computing pour traiter les requêtes avec la pertinence attendue ;
  • elles ne dépendent pas de la connexion réseau pour fonctionner et sont fiables en permanence ;
  • elles sont peu gourmandes en ressources matérielles.

L’efficacité des solutions embarquées repose d’une part sur la qualité des technologies utilisées, d’autre part sur la richesse des scénarios embarqués. Elles disposent de suffisamment de scénarios pour couvrir l’ensemble des besoins utilisateurs. Et dans un usage B2B ou métier, elles permettent d’enrichir la conversation en intégrant à la fois le vocabulaire métiers dédié et les types de requêtes attendues. Elles sont en revanche plus rigide quand il s’agit d’embarquer de nouveaux usages, non prévus initialement. 

L’hybride, une alternative de choix ?

La troisième option est celle des solutions hybrides, à la fois connectées et on-premise. Les bénéfices portent sur la gestion à distance de la solution, notamment sa maintenance, la connectivité à des services tiers pour compléter les fonctions de la solution embarquée, l’analyse des données pour améliorer le service. Les solutions hybrides réconcilient les deux mondes, avec une exposition au risque qui peut être mieux contrôlée.

Définir une vision stratégique claire

Selon l’usage B2C ou B2B qu’on en attend, il va de soi qu’on ne choisira pas la même solution vocale. Le premier critère de choix reste la vocation de cette interface : si elle est utilisée pour fluidifier des process métiers, par exemple la gestion logistique d’une grande enseigne, la précision de la solution pour faire face aux divers scénarios et attentes métiers prime sur l’utilité d’une amélioration continue du service. Si sa vocation est grand public, une solution hybride ou connectée peut être une solution intéressante. Le choix final repose sur de nombreux critères, parmi lesquels :

  • la transparence et la confiance avec l’utilisateur, qu’il soit collaborateur ou client ;
  • la nécessité de préserver l’intégrité des données : on pense bien sûr à l’usage bancaire, mais aussi dans le cadre d’un service d’aide aux personnes dépendantes ;
  • le besoin de protection de la vie privée ;
  • ou encore son utilisation dans un environnement partagé.

A l’heure de la transformation digitale des entreprises, l’intégration des interfaces vocales est un enjeu clé du succès : véritable révolution, les assistants vocaux font entrer les marques dans l’ère du marketing conversationnel.