Numérisation de textes historiques : l'UE fait appel à IBM

Financé par l'UE, et développé par des chercheurs d'IBM Haïfa, le projet Impact  (IMProving ACces Text soit l'amélioration de l'accès au texte), va procéder à une numérisation des textes historiques rares et culturellement significatifs de plus de vingt structures européennes : bibliothèques nationales, instituts de recherche, universités et entreprises. Le but étant de les rendre largement accessibles, modifiables et consultables en ligne.

Pour corriger les erreurs de la reconnaissance optique de caractères parfois difficilement lisibles, Impact s'appuiera aussi sur de grands groupes de bénévoles répartis sur le continent chargés de vérifier l'exactitude des textes numérisés. Cette méthode dite du "crowd computing" (la foule assistant les ordinateurs) est aussi celle utilisée par Google suite au rachat de reCaptcha, dont le système antirobot demandant aux internautes de recopier des caractères permet aussi de les faire participer à la correcte numérisation des ouvrages.