Après Babel : vers une traduction multilingue instantanée

Internet en 2049 : maîtres ou esclaves du numérique ? Le JDN publie chaque jour en avant-première un extrait du livre de Benoît Sillard et vous propose de partager votre vision de l'Internet en 2049.

Un des principaux obstacles à l'exploitation optimale de l'intelligence collective comme de la production collaborative est constitué par la barrière des langues. On trouve autant de blogs en japonais qu'en anglais, et les Chinois ont presque autant de sites que les Américains : mais ces contenus se juxtaposent en s'ignorant.

Le problème n'est pas nouveau puisqu'en 1629 déjà, René Descartes imaginait la possibilité d'une langue universelle où chaque son dénoterait une idée !

Le mandarin (1,12 milliard de locuteurs au total), l'anglais (920 millions), l'hindi et l'ourdou (740 millions), le français (590 millions), l'arabe (482 millions), l'espagnol (380 millions) et le russe (285 millions) forment autant de grands ensembles qui sont en partie étanches. Les vingt et une langues les plus parlées dans le monde représentent les deux tiers des habitants de la planète, ce qui fait déjà une grande diversité interne, et exclut de surcroît un tiers des humains dont l'espace linguistique est plus restreint.

Dans certains domaines comme le commerce ou la science, un anglais appauvri s'est imposé comme une langue minimale d'échange. Mais cette évolution spontanée tenant aux rapports de force politiques et économiques du XXe siècle n'est pas très satisfaisante. Et elle risque de ne pas durer compte tenu du poids croissant de l'Asie dans le monde. En tout état de cause, le social knowledge est d'autant plus efficace que chaque locuteur peut exprimer dans sa langue maternelle toutes les ressources et toutes les nuances de son esprit.

Imaginons un web où un système de traduction automatique, en temps réel, d'excellente qualité, permette d'étendre chaque requête au monde entier et de partager tous les contenus : la capacité collaborative et créative de l'humanité serait démultipliée par cette communication universelle !

Pour l'instant, nous sommes assez éloignés de ce rêve. Les services de traduction automatique comme celui proposé par Google ne donnent qu'une idée assez approximative des pages traduites. Le moteur de recherche procède par indexation systématique de certains sites de référence – comme par exemple celui de la Communauté européenne, traduit par des professionnels en onze langues. Cela permet, grâce à l'accélération constante de la puissance de calcul, d'aller rechercher certaines expressions exactes et d'en donner une traduction identique.

Les machines restant défaillantes, les solutions actuelles sont le fait de traducteurs humains. Des volontaires chinois traduisent chaque jour les titres les plus importants de la presse anglo-saxonne (Eco). Sur Global Voices, des volontaires développent une base de données en une vingtaine de langues. Le réseau anglo-arabe Meedan a été lancé par Ed Bice afin de rapprocher les locuteurs anglophones et arabophones, qui ont été éloignés par les perspectives géopolitiques de " guerre des civilisations " de la Maison Blanche, mais aussi tout simplement par une incompréhension linguistique à la base. De manière plus commerciale, le service SpeakLike a été lancé à la fin 2009 sur le modèle du Mechanical Turk d'Amazon : plusieurs dizaines de milliers de sous-traitants volontaires dans le monde permettent une traduction en quelques heures, pour un tarif allant de 5 à 20 centimes le mot. Le service concerne principalement les mails, chats, tweets ou blogs, il s'adresse avant tout aux entreprises globalisées et confrontées à la barrière des langues, mais peut intéresser les particuliers. De même, le système open source Worldwide Lexicon se propose d'offrir aux internautes un contrôle efficace de la traduction de leurs contenus, soit en ayant recours à des logiciels automatiques (avec correction des erreurs observées) soit en se connectant à SpeakLike.

Il reste que la sous-traitance humaine n'est qu'un palliatif. Certains logiciels comme Systran, Prompt ou même Google Translate donnent au moins des résultats compréhensibles pour les grandes lignes d'un document, à défaut d'être correctement rédigés en raison des innombrables pièges que recèlent nos langues vernaculaires. En février 2010, Google a même annoncé un système de traduction vocale automatique des conversations sur mobiles, exprimant clairement sa volonté d'occuper le terrain linguistique à l'avenir.

Beaucoup de chercheurs considèrent que le problème du langage sera résolu en même temps que celui de l'intelligence artificielle. En 1950, le chercheur anglais Alan Turing, qui avait inventé le principe du calculateur universel (ancêtre de l'ordinateur moderne) dans les années 1930, a proposé un célèbre test : selon lui, le meilleur moyen de décider si une machine est intelligente ou non est de laisser un jury humain discuter à travers une cloison et par écrit avec un interlocuteur. Lorsque le jury sera incapable de discerner une machine d'un homme au cours de la discussion, on sera en présence d'une véritable intelligence artificielle. Le prix Loebner organise chaque année une compétition d'intelligence artificielle avec un test de Turing – sans succès à ce jour. Mais à mesure que les capacités de calcul sériel de l'ordinateur se rapprochent de celles d'un cerveau humain (qui opère en calcul parallèle), que des bases de données internationales constituent une source universelle de toutes les expressions déjà traduites sur le réseau et que des algorithmes d'apprentissage itératif sont développés, certains pensent que la traduction automatique donnera des résultats de plus en plus corrects dans les années à venir. En levant l'obstacle linguistique, le social knowledge deviendra alors... un universal knowledge.

Dans ce système universel de connaissance, certains pourraient craindre une homogénéisation, une massification, un appauvrissement. Il n'en est rien, comme nous allons l'expliquer dans le prochain chapitre : l'abondance inédite des informations et des savoirs voit émerger de multiples communautés d'usage et de partage, dans le sillage de la longue traîne.

Participez au débat : quelles applications pour la traduction universelle ?

Participez au livre Maîtres ou Esclaves du numérique. Quelles applications pour la traduction universelle ? Utilisez les commentaires Facebook ci-dessous pour partager vos avis avec votre réseau.

Après Babel : vers une traduction multilingue instantanée

Guides

Repères