ANALYSE
Sommaire Intranet-Extranet 
La traduction automatique à la recherche de la perfection
Les logiciels de traduction automatique ont standardisé leur base de connaissance. Ils essaient désormais de faire la différence au niveau de l'analyse et de passer d'une traduction écrite à une traduction orale.   (01/03/2007)
  En savoir plus
Dossier Numériser, gérer et publier ses contenus
La traduction automatique par ordinateur, ou TAO, longtemps réservée à des usages publics (défense, gouvernement, administration), gagne aujourd'hui les entreprises et les particuliers sous l'impulsion des technologies Web, des progrès en informatique et de la mondialisation culturelle et économique.

En effet, alors que la demande potentielle est énorme, la TAO reste aujourd'hui un marché de niche. Systran, l'un des tous premiers acteurs (84% de parts de marché pour la TAO en version boîte selon le cabinet GFK), ne réalise pourtant que 10 millions d'euros de chiffre d'affaires par an. La raison de ce retard s'explique en partie par le coût de ces solutions, de l'ordre du millier d'euros, mais pas uniquement.

Les logiciels de traduction automatique souffrent d'une mauvaise image qui leur colle à la peau depuis les premières versions. En effet, au début des années 1960, la traduction automatique se contente d'une traduction mot à mot, complétée par une base de données d'expressions courantes. Cette première méthode sera ensuite enrichie par des modules métiers spécifiques (informatique, santé, militaire…).

C'est d'ailleurs à cette époque qu'émerge en plein contexte de guerre froide, les sociétés Systran et Prompt, aujourd'hui toujours aux premières loges. La première est américaine, et travaille pour la CIA à assurer la traduction automatique de textes anglais vers le russe. La seconde, de nationalité russe, effectue le travail inverse pour le compte de son pays.

En effet, au milieu des années 1990, lorsque ces logiciels quittent les environnements grands systèmes pour s'installer sur le poste client Windows, la traduction automatique s'est enrichie d'une dizaine de paires de langues supplémentaires et d'une analyse statistique. Plutôt que de traiter les mots à traduire directement, les logiciels de traduction s'essaient à l'analyse contextuelle.

L'analyse statistique améliore la traduction contextuelle
Grâce à l'augmentation de la puissance de calculs, ils peuvent digérer des dictionnaires énormes, de plusieurs gigaoctects, et calculer pour une phrase donnée l'ensemble des traductions possibles, même les plus farfelues. Un moteur d'analyse statistique compare ensuite ces différentes traductions avec les précédentes et en déduit le contexte. Ils traduisent aussi bien les données brutes, que les fichiers textes (PDF, HTML, Word, TXT, Excel, ODF…).

L'analyse contextuelle peut également se faire à partir d'une base de référence statistique. Il s'agit d'introduire dans le logiciel un module poésie par exemple, affichant pour un texte donné quelle est sa traduction exacte. Lorsque le moteur analyse un nouveau texte à traduire, il le compare à cette base poésie de référence et s'il trouve un contexte similaire, essaie d'appliquer le même type de traduction.

"Un logiciel de traduction ne réalise pas qu'une analyse syntaxique. Il faut déjà une analyse orthographique, pour s'assurer que le document ne comporte pas de fautes. Ensuite vient l'analyse syntaxique, de manière à déterminer où se trouvent le sujet, le verbe et le complément. Puis l'analyse sémantique détermine s'il s'agit d'un sujet politique, juridique, économique. Enfin, vient le travail de traduction proprement dit", déclare Pierre Bernassau, directeur marketing EMEA chez Systran.

"Lors de la traduction, notre moteur va d'abord décortiquer les mots de la langue source vers la langue cible. Il analyse les phrases produites et les corrige si besoin. Ce travail dépasse une simple consolidation de dictionnaires", souligne Pierre Bernassau. Mais pour que la correction de texte soit la plus précise possible, la constitution d'un vocabulaire précis est souvent de rigueur.

"Si une entreprise dispose d'un vocabulaire métier, nous pouvons l'importer sinon il faudra le constituer. En général, nous obtenons un rendu très satisfaisant à partir d'un millier de mots saisis, et un rendu optimum entre 2000 et 4000 mots. Cela nécessite entre 1 et 3 mois de travail", explique Pierre Bernasseau.

Le développement du Web et des outils gratuits font naître le besoin
Les solutions de traduction automatique ont vu un nouvel eldorado avec le développement du Web. Systran s'est ainsi associé à Altavista pour fonder Babel Web, l'un des tous premiers traducteurs automatiques gratuits. Il équipe encore aujourd'hui les portails de Yahoo, Free, Orange et le service Google Traduction.

Très vite, il a été rejoint par une foule de nouveaux petits acteurs comme IM Translator, Reverso Online, FreeTranslation, Worldlind ou Freelanguagetranslation. Toutefois, en raison de la gratuité du Web, la plupart des outils disponibles se limitent à un moteur sans vocabulaire métier ou à des dictionnaires traduisant mot à mot.

En entreprise, les applications à la traduction automatique se multiplient dans les groupes internationaux, qu'il s'agisse de traduire des catalogues, une documentation technique, un intranet, un logiciel métier ou le compte rendu d'une réunion.

L'Union Européenne, où le multi linguisme est de rigueur, a ainsi fondé sa propre association dédiée à la recherche sur les méthodes de traduction automatique, l'EAMT (European Association for Machine Translation). En France, le GETA (Groupe d'Etude pour la Traduction Automatique) effectue des travaux similaires en ciblant la traduction à des fins de veille, de traduction automatique d'écrits ou pour assister les traducteurs manuels dans leur tâche.

Un dernier champ d'application monte d'ailleurs ces dernières années : celui de la traduction orale. "Nous avons des travaux en cours pour s'associer aux produits de reconnaissance vocale de la société Nuance, Dragon Naturally Speaking. C'est encore du domaine de la recherche, même si la reconnaissance vocale comme les logiciels de traduction ont fait beaucoup de progrès ces dernières années", ajoute Pierre Bernassau.

  En savoir plus
Dossier Numériser, gérer et publier ses contenus
IBM a dernièrement réalisé pour le compte des forces spéciales américaines un logiciel de traduction automatique à l'oral de l'anglais vers l'arabe. Derrière ce projet, baptisé Mastor, l'enjeu consiste à faciliter le dialogue entre les forces de sécurité irakiennes et l'armée américaine.

Yves DROTHIER, JDN Solutions Sommaire Intranet-Extranet
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters