Vers un compromis entre analyse statistique et syntaxique

exemple de traductions obtenues depuis le logiciel
Exemple de traductions obtenues depuis le logiciel © Systran

"Le fonctionnement d'un moteur d'analyse statistique est relativement simple : il tape sur le Web le mot recherché et détermine la traduction qui semble la plus probable. Le rendu d'un moteur d'analyse statistique est généralement plus fluide à lire qu'un moteur d'analyse syntaxique, mais il a tendance à manquer de précision. D'autre part, il n'apprend pas des schémas linguistiques mais de petits morceaux de phrases. Et il ne gère pas des exceptions comme les noms propres qui ne se traduise pas", souligne Jean Senellart, directeur R&D de Systran.

Pour obtenir cette fluidité dans la traduction, le moteur de recherche statistique analyse également le rendu de la traduction sur le Web. Par exemple, s'il a traduit "adaptées à différents secteurs" par "appropriate for various sectors", il va vérifier le nombre d'occurence trouvées sur le Web pour "appriopriate for various sectors". Si d'autres traductions génèrent plus d'occurences dans les moteurs, il sera capable de s'adapter, ou de rajouter des mots pour rendre la lecture plus fluide.

Mais avec cette analyse seule, une traduction incorrecte peut être tout à fait fluide, mais n'avoir aucun sens pour l'utilisateur.