La récente publication
(26 juin) par le World Wide Web Consortium (W3C)
de la spécification sur la mise en place de grammaires
pour la reconnaissance de la parole - qui doit permettre
aux auteurs d'applications vocales de créer des règles
décrivant les possibilités de réponses d'utilisateurs
après l'écoute de messages d'un serveur vocal - offre
l'occasion de faire le point sur l'activité du
groupe de travail du W3C autour de Voice Browser (navigateur
vocal), définissant un ensemble de jeux de balises auxquels
la spécification du 26 juin vient s'ajouter. L'objectif
est de fournir des solutions permettant de parler et
écouter sur le Web.
Le téléphone
plus porteur que le PC
Partant
du constat que la téléphonie mobile, très en vogue et
bien démocratisée, allait toucher beaucoup plus de gens
que l'ordinateur personnel, des chercheurs de Bell Labs
d'AT&T ont imaginé le projet "phone Web" au milieu des
années 90. Une passerelle équipée d'un navigateur vocal
interprétant un langage de dialogue permettrait de délivrer
du contenu et des services Web à un téléphone. Début
1999, des compagnies créent leur propre langage : un
standard s'impose. AT&T, IBM, Lucent Technologies et
Motorola s'unissent alors pour fonder le VoiceXML
Forum en vue de rédiger la spécification du langage
VoiceXML. Ce standard est géré par le groupe de travail
du WC3 depuis le milieu de l'année 2000.
La
reconnaissance vocale grâce à VoiceXML
Le
groupe de travail du WC3 a ainsi mis au point une série
de jeux de balises pour répondre aux besoins suscités
par cette nouvelle technologie. VoiceXML, dont la deuxième
version est sortie en novembre 2001, est un langage
de description des interactions hommes-machines. Une
application développée en VoiceXML doit permettre de
"parler" à l'utilisateur en synthétisant de la parole,
mais également "écouter" la voix de l'utilisateur
grâce à la reconnaissance vocale.
De nombreux jeux de
balises permettent ajourd'hui à l'utilisateur
de répondre à l'application : Speech Synthesis
Markup Language (synthèse vocale), Speech Grammar
pour la reconnaissance de la parole à l'aide de grammaires,
Semantic Interpretation for Speech Recognition pour
la reconnaissance vocale à l'aide de l'interprétation
sémantique
L'objectif initial du projet était de fournir un accès
Internet par téléphone, mobile ou filaire. Mais aujourd'hui
les enjeux ont sensiblement évolué. Les utilisateurs
du téléphone ne sont plus les seules cibles visées:
on peut citer par exemple les non-voyants désirant
accéder au Web. Toutefois, les progrès
dans ce domaine sont moins tangibles que la communication
autour d'eux. VoiceXML en est le contre-exemple.
|