Google se lance dans la reconnaissance optique des caractères

Le moteur de recherche a annoncé la renaissance d'un logiciel open source de reconnaissance de caractères. Issu du logiciel Tesseract, développé par HP entre 1985 et 1995 avant d'être abandonné, le moteur a corrigé les bugs les plus importants. Le logiciel permet de convertir rapidement un document papier en un texte indexable par les moteurs.