INFRASTRUCTURE
Sommaire Infrastructure 
Dialoguer avec l'ordinateur : du langage naturel, sinon rien
La reconnaissance et la synthèse vocale sont devenues des réalités. Mais tant que leur capacité à appréhender intégralement le langage naturel ne sera pas acquise, les applications finales resteront tronquées.   (20/09/2006)
  En savoir plus
 Prosodie
 Chez Norauto, on pilote l'entrepôt à la voix
  Le site
Nuance
Pour communiquer avec les machines (ordinateurs, téléphones portables, PDA, etc), l'utilisateur dispose de moyens divers : tactiles en entrée (clavier, souris), les périphériques de communication sont visuels (écran) ou sonores (enceintes) en sortie.

Afin de rendre leur utilisation toujours plus naturelle, les machines se dotent désormais de solutions capables de comprendre le langage humain. Et certaines peuvent même répondre ! C'est le miracle de la reconnaissance et de la synthèse vocale.

Les technologies de reconnaissance vocale ne datent pas d'hier. Les premiers outils de dictée sont apparues dès 1994 mais nécessitaient des efforts de prononciation assez conséquents. "Simply Speaking d'IBM ou Dragon Dictate de Nuance étaient des systèmes à parole discontinue", se souvient Christophe Van Mighem, responsable commercial des solutions Dragon Pro chez Nuance.

En d'autres termes, une pause entre chaque mot était indispensable pour la bonne compréhension du système. Et le temps d'apprentissage était dissuasif : "pour obtenir de bons résultats, l'utilisateur devait lire les phrases du module d'apprentissage sur plus d'une heure et demie", précise-t-il.

Aujourd'hui, l'apprentissage est encore souvent nécessaire mais réduit à quelques minutes seulement, notamment grâce à l'amélioration des algorithmes de traitement du son, au nombre de profils vocaux reconnus (hauteur de la voix, spectre, etc), qui intègrent une meilleure gestion des accents mais aussi, bien sûr, grâce à la puissance de calcul des machines.

"Si l'utilisateur fait preuve d'une bonne qualité de diction et utilise régulièrement les outils de correction pour l'apprentissage du système, la machine peut reconnaître jusqu'à 99% du texte dicté", explique le responsable commercial.

"Il est possible de piloter son ordinateur à la voix"
(C. Van Mighem - Nuance)
A terme, le but est de permettre à l'utilisateur de parler en langage naturel. "Les futurs outils devraient être capables de supprimer les hésitations du dictant et même de générer les signes de ponctuation en fonction de son intonation" poursuit-il.

François Chaffard, responsable d'offres - division contacts - de Prosodie, va même plus loin : "La seule limite imposée est la reconnaissance de l'oreille humaine : ce qu'un humain ne peut pas comprendre, la machine ne le pourra pas non plus".

La maturité des systèmes permet ainsi d'envisager de nouveaux usages en plus de la dictée vocale. "Il est désormais possible de piloter intégralement son ordinateur à la voix, explique Christophe Van Mighem. Les personnes dont la mobilité des membres supérieurs est réduite deviennent ainsi totalement autonomes face à leur écran".

"La reconnaissance vocale trouve également son application en matière de serveurs vocaux, poursuit François Chaffard. Pour éviter les menus interminables, l'utilisateur est invité à prononcer sa requête. En fonction des mots-clés reconnus, il sera dirigé vers le service approprié". Parmi les grands consommateurs de ce genre de services, on retrouve des acteurs de la grande distribution ou encore du secteur bancaire.

Prosodie a par exemple développé pour Intrum Justitia, une société de gestion de créances, le premier service automatique de recouvrement de créances par téléphone. A l'aide d'un menu vocal, le débiteur peut choisir de régler sa dette automatiquement par téléphone : il s'identifie à l'aide de son code confidentiel, le système restitue vocalement les coordonnées du débiteur, la somme à régler et le nom de la société créancière et le débiteur n'a plus qu'à accepter.

Parler aux machines, c'est bien. Quand elles nous répondent, c'est encore mieux ! Et plus seulement par un texte pré-enregistré. Les technologies de synthèse offrent désormais aux machines la possibilité de s'exprimer par la voix. Fiction dans les années 1980, K 2000 pourrait bien devenir réalité dans quelques années !

"Il suffit d'apprendre à lire à l'ordinateur"
(G.Luzé - Nuance)
Comment cela est-il possible ? "Comme à un enfant, il suffit d'apprendre à lire à la machine, explique Guillaume Luzé, responsable commercial de la synthèse vocale et des solutions embarquées chez Nuance. Elle crée ses réponses au format texte, qu'elle est ensuite capable de restituer sous forme de son".

Et dans un langage de plus en plus naturel, qui est, selon Guillaume Luzé, la clé du succès de la synthèse vocale : "Nuance propose des outils adaptés aux spécifités régionales des langues telles que le français canadien, le portugais brésilien ou l'espagnol mexicain. Un module anglais américain avec accent espagnol est même disponible pour les communautés hispaniques du sud des Etats-Unis", ajoute Guillaume Luzé.

  En savoir plus
 Prosodie
 Chez Norauto, on pilote l'entrepôt à la voix
  Le site
Nuance
Comparé à la répétition de textes pré-enregistrés, le "discours" de la machine devient ainsi totalement dynamique, en fonction du contexte et "sans aucune limitation", souligne le responsable commercial. De nombreux usages sont dès lors envisageables.

"Les principaux débouchés sont les appareils mobiles et les serveurs vocaux", se réjouit-il. La synthèse vocale d'un système de navigation par satellite va pouvoir par exemple guider un conducteur tout le long de son parcours sans qu'il quitte la route des yeux. "La seule limite d'usage est l'imagination de nos clients", conclut François Chaffard.

Ludovic TICHIT, JDN Solutions Sommaire Infrastructure
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters