 |
|
|
| |
|
|
| Sommaire
Infrastructure |
 |
| Reconnaissance vocale : le W3C introduit les compléments de VoiceXML 3.0 |
| SSML, XHTML+Voice, CCXML... En plus de VoiceXML, les développeurs disposent de nouvelles spécifications pour leurs plates-formes de reconnaissance vocale.
(31/01/2006) |
|
Le World Wide Web Consortium (W3C) a présenté fin 2005 plusieurs éléments visant à compléter son interface de développement de fonctions de reconnaissance vocale VoiceXML.
Cette dernière, dans sa version 3.0 - encore à l'état de brouillon - sera acompagnée, sous peu, de nouvelles spécifications censées faciliter la création de plates-formes plus ouvertes.
Petit retour en arrière : c'est en 2000 que le W3C a mis en place ses premières grammaires pour la reconnaissance de la parole. Elles devaient permettre aux auteurs d'applications vocales de créer des règles décrivant les possibilités de réponse aux utilisateurs accédant à un serveur vocal. Par un jeu de balises, ces spécifications apportent aux solutions un nouveau niveau d'interaction avec l'utilisateur, le tout réalisé via la norme XML.
Le projet VoiceXML 3.0 étend les fonctions initiales de cette infrastructure, jusqu'ici limitée à certaines possibilités - telle l'authentification du locuteur. Les nouveaux composants accompagnant l'infrastructure contribuant à renforcer le lien avec les applications.
- Speech Synthesis Markup Language
Le SSML est un langage de vérification apportant des balises XML pour développer la synthèse vocale sur Internet mais aussi d'autres applications. Complément direct du VoiceXML, ce composant permet un contrôle extrêmement poussé du contenu synthétisé (prononciation, taux de codage, écho...).
Grâce à lui, la synthèse vocale multilingue est rendue possible.
Dans la même lignée, les composants Speech Grammar et Speech Recognition améliore la reconnaissance de la parole à l'aide de grammaires et à l'aide de l'interprétation sémantique.
- Speaker Verification Extension
Comme son nom l'indique, cette extension analyse le contenu des chaînes de communication. L'application - largement sécuritaire - trouvera sa place dans l'identification par téléphone. Elle s'inscrit dans la démarche de vérification biométrique et sécurise donc les accès audio, qu'il s'agisse de communications ou de transactions - tant pour la reconnaissance que la synthèse vocale.
- Call Control XML
Le CCXML est un module améliorant la gestion des appels sur le réseau. Cette spécification permet aux développeurs de dissocier les appels des applications vocales. L'idée est de réaliser un routage automatique vers les bons serveurs, pour des applications collaboratives de téléconférence par exemple. La même application pouvant dès lors autoriser un double service - appels et messages - simultanément.
- XHTML+Voice
Autre langage fournissant des balises VoiceXML, le XHTML+Voice rend les applications vocales ouvertes et accessibles aux personnes présentant un handicap. Utilisé seul - là où d'autres solutions nécessitent des périphériques tiers - il intègre des évènements XML et XHTML à l'interface vocale, et ce, par des modules proches des fonctionnalités du langage SSML.
Tous ces compléments figurent encore à l'état de brouillon, tout comme les spécifications VoiceXML 3.0. Ils sont le reflet du travail du W3C et du VoiceXML Forum, groupement industriel d'acteurs de la téléphonie et et de la reconnaissance vocale.
|
| |
| |
|
|
 |
|
 |
|