Comment indiquer la langue d'un contenu en HTML ? Indiquer la langue de traitement de la page HTML

Il est important sur une page Web d'indiquer clairement la langue du contenu. Les informations données sur la ou les langues du contenu seront utiles pour les outils d'indexation (moteurs de recherche), les outils de traduction automatique ou encore ceux de synthèse vocale. Par exemple, un lecteur d'écran a besoin de connaitre la langue du contenu pour pouvoir le lire correctement, quand cette langue diffère de ses paramètres par défaut. 

Indiquer la langue de traitement


On commencera par veiller à ce que chaque page HTML ait un attribut lang sur l'élément racine, qui indique la langue principale de la page. Mettons que notre page est en français:
 
 <html lang="fr">

L'attribut lang est utilisé pour indiquer un changement de langue

Ensuite, pour chaque contenu dont la langue diffère de celle indiquée sur l'élément racine, on va utiliser l'attribut lang pour indiquer le changement de langue. L'attribut peut être placé sur un élément qui existe déjà dans la structure HTML (un lien, un item de liste, un paragraphe, un titre...), ou bien on peut rajouter un élément div ou span pour englober le contenu dont on veut indiquer la langue:
 

 <blockquote> 
 <p>
   Ça va plus du tout. J'ai plus envie de boire ni de manger.
   J'ai plus envie de me peigner.
   J'suis limite <span lang="en">nervous breakdown</span>.
 </p>
<blockquote>

<p>
 <cite lang="en">Blade Runner</cite> est une adaptation du roman
 <cite lang="en">Do Androids Dream of Electric Sheep?</cite>
 de Philip K. Dick.
</p>


(Le code à utiliser pour une langue donnée est standardisé. On utilise des codes ISO 639-1 sur deux lettres. Voir aussi l'article Language Codes extrait de Building Accessible Websites de Joe Clark.).