|
|
Enon est non seulement capable d'obéir à des ordres et de répondre à des questions, mais aussi d'adopter des expressions faciales presques humaines : il semble nous comprendre.
|
|
Source : courtesy of Fujitsu
|
Un robot qui comprendrait nos paroles et converserait avec nous... En voilà un qui nous semblerait bien intelligent. Mais qu'on ne s'y trompe pas, l'ordinateur ne comprend pas vraiment : il reconnaît des signaux puis il les traite en fonction de ses programmes.
Au coeur d'un robot qui "comprend", un système de reconnaissance et de commande vocale.
Reconnaissance vocale
La reconnaissance vocale nécessite une étape préalable : l'utilisateur doit répéter au robot différents phonèmes, afin qu'il se constitue un dictionnaire de références acoustiques. (Il existe une trentaine de phonèmes en français. Par exemple, le mot "cou" est formé des phonèmes "keu" et "ou".) Le robot possède également une base avec des données articulatoires, phonétiques, syntaxiques, sémantiques, ainsi qu'un système expert qui effectue les interprétations et déductions nécessaires.
Pour reconnaître un son, les "oreilles" du robot sont des micros. Une fois capté, le signal vocal est numérisé. Il est ensuite découpé en segments élémentaires (qui représentent les phonèmes), dont les "images acoustiques" sont comparées à celles du dictionnaire de référence. Ce système permet de reconnaître de grands vocabulaires.
Des relations hommes-robot
La commande vocale est une des clés pour créer une relation entre l'humain et le robot. Pas étonnant que les robots de compagnie en soient équipés. Papero, par exemple, est en mesure de comprendre 650 expressions et peut en prononcer plus de 3 000. Sa technologie de reconnaissance de la parole permet aux utilisateurs de le contrôler à l'aide de commandes vocales. Pratique pour les personnes qui ne peuvent pas ou ne savent pas utiliser un clavier.
Enon, le robot humanoïde à roue de Fujitsu, en vente au Japon depuis septembre 2005, est équipé, lui aussi de ce système. Grâce à 4 micros, 6 caméras, 3 capteurs ultrason et 3 capteurs de contact, il peut non seulement servir de guide et renseigner les personnes. mais aussi afficher des "expressions" sur sa "tête" équipée de diodes électroluminescentes. De quoi donner à l'utilisateur l'illusion qu'il est effectivement compris. S'il vous intéresse, sachez tout de même qu'il coûte 54 000 dollars et ne "comprend" que le japonais.