XML pour la reconnaissance vocale

BOURSE

Relation-Client

XML pour la reconnaissance vocale

VoiceXML, technologie de reconnaissance vocale, regroupe une série de jeux de balises permettant de parler et écouter sur le web. (Lundi 8 juillet 2002)

La récente publication (26 juin) par le World Wide Web Consortium (W3C) de la spécification sur la mise en place de grammaires pour la reconnaissance de la parole - qui doit permettre aux auteurs d'applications vocales de créer des règles décrivant les possibilités de réponses d'utilisateurs après l'écoute de messages d'un serveur vocal - offre l'occasion de faire le point sur l'activité du groupe de travail du W3C autour de Voice Browser (navigateur vocal), définissant un ensemble de jeux de balises auxquels la spécification du 26 juin vient s'ajouter. L'objectif est de fournir des solutions permettant de parler et écouter sur le Web.

Le téléphone plus porteur que le PC

Partant du constat que la téléphonie mobile, très en vogue et bien démocratisée, allait toucher beaucoup plus de gens que l'ordinateur personnel, des chercheurs de Bell Labs d'AT&T ont imaginé le projet "phone Web" au milieu des années 90. Une passerelle équipée d'un navigateur vocal interprétant un langage de dialogue permettrait de délivrer du contenu et des services Web à un téléphone. Début 1999, des compagnies créent leur propre langage : un standard s'impose. AT&T, IBM, Lucent Technologies et Motorola s'unissent alors pour fonder le VoiceXML Forum en vue de rédiger la spécification du langage VoiceXML. Ce standard est géré par le groupe de travail du WC3 depuis le milieu de l'année 2000.

La reconnaissance vocale grâce à VoiceXML

Le groupe de travail du WC3 a ainsi mis au point une série de jeux de balises pour répondre aux besoins suscités par cette nouvelle technologie. VoiceXML, dont la deuxième version est sortie en novembre 2001, est un langage de description des interactions hommes-machines. Une application développée en VoiceXML doit permettre de "parler" à l'utilisateur en synthétisant de la parole, mais également "écouter" la voix de l'utilisateur grâce à la reconnaissance vocale.
De nombreux jeux de balises permettent ajourd'hui à l'utilisateur de répondre à l'application : Speech Synthesis Markup Language (synthèse vocale), Speech Grammar pour la reconnaissance de la parole à l'aide de grammaires, Semantic Interpretation for Speech Recognition pour la reconnaissance vocale à l'aide de l'interprétation sémantique

L'objectif initial du projet était de fournir un accès Internet par téléphone, mobile ou filaire. Mais aujourd'hui les enjeux ont sensiblement évolué. Les utilisateurs du téléphone ne sont plus les seules cibles visées: on peut citer par exemple les non-voyants désirant accéder au Web. Toutefois, les progrès dans ce domaine sont moins tangibles que la communication autour d'eux. VoiceXML en est le contre-exemple.

[Serge Descombes, JDNet]

Accueil | Haut de page

Nouvelles offres d'emploi sur Emploi Center

Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY