Acteurs > 3 questions à Philippe Jeanrenaud - Nuance Communications
3 QUESTIONS A...
 
12/06/2007

Philippe Jeanrenaud (Nuance) : "La recherche par la voix offre de nombreuses perspectives de développement"

Suite au rachat de Voice Signal Technologies, Nuance Communications dispose d'une application prête au déploiement pour les téléphones mobiles. Un marché encore limitatif mais à fort potentiel.
  Envoyer Imprimer  

 

JDN Solutions. Pourquoi ce rachat sur le marché des téléphones mobiles ? Vos produits de reconnaissance vocale existant n'étaient-ils pas adaptables ?

 
Philippe Jeanrenaud, responsable marketing solutions embarquées - Nuance Communications
 

Philippe Jeanrenaud. Le rachat de VST [ndlr : Voice Signal Technologies] nous apporte une série de produits qui ont fait leurs preuves dans ce domaine. Vsuite couvre des applications telles que l'appel par la voix, la recherche de contacts par la voix, l'envoi de message par la voix. Il est possible de dicter ses SMS soit de manière discrète, en introduisant des silences entre les mots, soit en continu. L'avantage de la méthode discrète est ici de réduire le besoin en ressources CPU, étant parfois limité par le téléphone.

Cette offre ne fonctionne que sur certains modèles de téléphones mobiles, notamment les Motorola et Samsung, car elle doit être intégrée au système d'exploitation fermé du constructeur. C'est malheureusement le cas pour la plupart des téléphones milieu de gamm. Ils fonctionnent avec des systèmes d'exploitation fermés, contrairement au haut de gamme qui utilise plutôt des OS comme Symbian ou Windows Mobile. Sur le milieu de gamme, VST est bien implanté avec des solutions qui existent depuis maintenant plus de 2 ans.

En matière de téléphonie mobile, nous disposions également d'une partie des technologies VST, mais sans être prêt à les déployer. L'approche de VST a été de se concentrer sur une application en particulier – la téléphonie mobile - et de la déployer sur toute une série des plates-formes. Chez Nuance, nous travaillons plutôt au cas par cas à partir d'une technologie de base. Or, dans la téléphonie mobile ce modèle ne nous permettait pas d'approcher un certain nombre de vendeurs. VST, au contraire, a standardisé une application ce qui permet aux constructeurs de la déployer à moindre frais.

Quelles spécificités sont propres au marché de la reconnaissance vocale sur mobile ? Le rachat de Voice Signal va-t-il vous apporter de nouvelles technologies ?

D'abord, le marché des téléphones mobiles comporte plusieurs limitations. Le micro est un facteur important dans le cas de la reconnaissance vocale, or beaucoup de téléphones mobiles ne possèdent pas une entrée audio de qualité. Pour réaliser une bonne transcription, il faut un micro de 16 Khz, alors que la moyenne est plutôt de 8 Khz. La deuxième limite concerne le contexte bruité. Il n'est pas rare en effet que l'utilisateur téléphone dans un environnement relativement bruyant.

"Notre expérience sur le marché de l'automobile nous a permis de rendre la reconnaissance vocale moins sensible aux bruits parasites"

Notre expérience sur le marché de l'automobile nous a toutefois permis de rendre la reconnaissance vocale moins sensible aux bruits parasites. Dernière limitation, comme la puissance de calcul des téléphones est limitée, nous sommes obligés de réduire le vocabulaire utilisable. Là où nous proposons de 500 000 à 600 000 mots sur PC avec une application comme Dragon, la dictée de SMS se limite à 50 000 mots.

Avec le rachat de VST, nous intégrons un nouveau produit, Vsearch, qui nous offre plusieurs perspectives de développement. Il s'agit d'une offre dans le domaine de la recherche par voix, que ce soit sur le téléphone pour chercher ses contacts, ou de manière déportée pour chercher du contenu, des adresses... A partir de cette technologie, on peut imaginer tout un tas d'applications : recherche de restaurants via les pages jaunes, recherche de musiques par titres, etc. Enfin, nous n'avions pas d'offres de dictée vocale sur téléphone mobile contrairement à VST.

Ce rachat va-t-il permettre à Nuance de retrouver la rentabilité ? Sur quels autres segments anticipez-vous de la croissance en matière de reconnaissance vocale ?

Il est clair que la téléphonie mobile est un marché à fort potentiel. Le nombre de téléphones portables sur le marché, le taux de renouvellement, l'augmentation de la puissance de calcul et la quête par l'utilisateur de nouvelles applications nous font espérer un bel avenir pour le marché de la reconnaissance vocale. Nous sommes convaincus qu'il y a un besoin d'une interface complémentaire au clavier sur les téléphones.

 
En savoir plus
 
 
 

Nous regardons aussi de près les nouveaux usages des téléphones mobiles, notamment Internet et la télévision. On peut imaginer que la recherche par la voix va se multiplier dans ces domaines. Des gens comme Google seront évidemment mieux placés que nous pour traduire ces recherches non structurées en résultats. Mais il y aura peut-être des partenariats à envisager pour bénéficier de synergies.

Nous voyons également du potentiel sur des marchés tels que l'automobile. Il s'agit de pouvoir rechercher de la musique et jouer tel ou tel album sans toucher à son auto-radio, de pouvoir programmer par la voix son GPS... Ce genre de fonction va continuer à se développer. La traduction orale est aussi un domaine auquel nous nous intéressons. Nous n'y avons pas encore beaucoup investi d'argent, mais nous avons reçu des demandes et à l'avenir nous pourrions imaginer de proposer une offre.


Envoyer Imprimer Haut de page