Pourquoi les entreprises ne doivent plus faire l'impasse sur le traitement de la voix ?

La valeur des données pour une entreprise n'est plus à prouver… à condition d'être en capacité de les exploiter. Si la question ne se pose plus pour l'ensemble des données structurées, les données vocales sont aujourd'hui peu, voire pas du tout captées et valorisées… Cette sous-exploitation est d'autant plus critique que ces données ont un potentiel immense et offrent des applications multiples, à forte valeur ajoutée.

La voix : une donnée pas comme les autres

La voix est le moyen le plus naturel et le plus utilisé pour communiquer. En effet, les échanges oraux, qui créent un volume de données vocales considérables, sont généralement beaucoup plus riches que les conversations écrites. Ces conversations orales laissent le champ libre aux émotions et à l’intuition pour capter l’information la plus pertinente en fonction du contexte. Et, c‘est sans compter la multitude des autres signaux faibles qui sont présents lors de conversations, tels que les pauses, les soupirs, le débit de parole, les intonations, etc. Cela souligne bien la complexité que revêt l’exploitation de la donnée vocale. D’abord parce qu’une grande partie de ces données n’est jamais captée, ou “enregistrée”, contrairement aux données textuelles désormais échangées par voie digitale. Ensuite, parce que les flux vocaux ne constituent pas immédiatement des données exploitables. Pour faire simple : il faut d’abord transformer les sons, qui sont des données non-structurées, en mots, qui sont des données structurées pour pouvoir les exploiter.

Un gisement de valeur désormais accessible

Heureusement, de récentes séries d’innovations technologiques autour du langage naturel permettent d’envisager sérieusement l’exploitation des données vocales pour de multiples cas d’usage. Au-delà du progrès réalisé au niveau de la captation et la transcription de ces données, il s’agit des percées majeures qui ont lieu en matière de speech recognition et de compréhension du langage naturel (NLU), deux domaines de l’Intelligence Artificielle. Ainsi, il est désormais possible pour les entreprises de développer des callbots ultra performants en termes d’expérience utilisateur, capables de tenir une conversation avec un humain, de bout en bout, grâce à des technologies de pointe, fonctionnant en temps réel, et cela à l’échelle industrielle tout en garantissant la sécurité des données. De même, ces technologies à l’état de l’art sont capables de retranscrire des masses de conversations vocales simultanément et d’en extraire automatiquement les informations essentielles, en temps réel, pour les saisir dans des outils métiers. Un moyen “d’augmenter” les collaborateurs qui, soulagés de l’effort de la saisie, se concentrent pleinement sur la qualité relationnelle de l’échange et sur les tâches à haute valeur ajoutée. Cela représente une révolution qui touchera bientôt de nombreux métiers : dans le domaine de la santé, par exemple, cela permet de soulager le personnel soignant en automatisant la saisie de comptes rendus médicaux ; en milieu industriel, les informations pourront être renseignées depuis les ateliers directement ; dans les services commerciaux les échanges pourront être plus qualitatifs et humains, etc.

Oralité et omnicanalité : des leviers de différenciation pour les entreprises

S’il ne fait donc plus aucun doute que les données vocales ont un potentiel immense désormais accessible, ce qui est encore plus intéressant pour les entreprises, c’est que leurs clients eux-mêmes plébiscitent l’usage de la voix. Et cette tendance que soulignent des études récentes s’est vue renforcée par la crise sanitaire. En effet, 62% des Français recherchent le contact humain pour les échanges avec les services clients* et privilégient donc le téléphone aux canaux écrits (mail, chat, SMS…). Ainsi, les entreprises qui sauront inscrire l’oralité au cœur de la relation client en proposant une interaction vocale de qualité, répondront aux attentes des consommateurs tout en augmentant les performances de leurs services clients. En filigrane, c’est le défi de l’omnicanalité qui se pose aux entreprises ou comment intégrer les canaux vocaux dans l’expérience client.

Le premier pas est bien sûr d’utiliser un callbot comme point d’aiguillage à l’entrée des centres d’appels. En dialoguant avec le client, en interagissant avec le système d’information de l’entreprise et en s’appuyant sur d’immenses bases de connaissances, cet agent conversationnel est capable de traiter de manière autonome la plupart des demandes simples, répétitives et à faible valeur ajoutée. Grâce à lui, le volume d’appels traités par des humains diminue et la satisfaction des clients augmente, sans compter que cet agent est disponible 24/24h 7/7j et parle toutes les langues. Pour les demandes plus complexes, il passe alors la main à un humain et devient son assistant conversationnel. Non seulement, il lui prépare tous les éléments concernant la demande du client, collectés en amont et stockés dans le CRM de l’entreprise par exemple, mais en plus, il assiste à la suite de l’échange vocal et se charge d’extraire tous les éléments essentiels de la conversation pour compléter le dossier en temps réel, libérant ainsi le téléconseiller de l’effort de saisie. Ainsi, la résolution du problème est facilitée, le téléconseiller est pleinement concentré sur la qualité relationnelle de l’échange et l’expérience client.

Nous entrons dans une nouvelle ère du traitement de la voix qui va profondément réinventer les échanges au sein du monde professionnel, que ce soit entre collaborateurs ou avec les clients. « Parler pour saisir. Parler pour rechercher. » sera ainsi la norme à l’avenir. Une nouvelle façon de travailler qui devra nécessairement intégrer une expérience utilisateur omnicanale et sur mesure.