L'analyse statistique renforce la qualité des traductions

l'architecture du logiciel dans sa version 7
L'architecture du logiciel dans sa version 7 © Systran

Le nouvel enjeu de la traduction, popularisée par Google, s'appelle l'analyse statistique. Un moteur d'analyse statistique aligne les morceaux de phrase et construit un espace de recherche très important. Il construit un modèle statistique et détermine, à partir de celui-ci, si "the" a plutôt 60% de chance de se traduire par "le", ou 20% selon le contexte dans lequel il s'inscrit.

Dans le cas de la version 7 de Systran, l'éditeur a intégré l'utilisation de modèles statistiques de traduction qu'il utilise pour améliorer sa traduction par domaine. En effet, sur un périmètre restreint, où la terminologie est spécifique, ce type d'analyse donne de bons résultats.

A l'inverse, il devient très compliqué de l'utiliser sur un périmètre large et inconnu comme le Web, puisqu'il faudrait pouvoir stocker des dizaines de milliards d'expressions pour compléter le moteur actuel.