HTML 5 : une révolution pour le référencement ?

Article, vidéo, audio, structuration des pages et des sites Web... La nouvelle version du langage apporte son lot de nouvelles balises. Elle donne une nouvelle dimension au Web sémantique

HTML 5 révolutionnera-t-il le référencement ? C'est encore difficile à dire. Cette spécification est en effet encore en cours de finalisation au sein du consortium W3C. Mais nombre de nouveaux éléments apportés par cette nouvelle version peuvent potentiellement entrainer un bouleversement des techniques de référencement.

Il est vrai que la plupart des navigateurs n'ont pas attendu la finalisation de HTML 5 pour commencer à le prendre en charge. C'est le cas des principaux d'entre eux (Internet Explorer, Firefox, Chrome). Reste qu'avant que les moteurs de recherche, Google et Bing en tête, ne le supportent, il faudra encore attendre que les sites Web se l'approprient et le mettent en œuvre.

Comparé à HTML 4, la version 5 du langage Web propose une nouvelle dimension en matière de description de contenus qui va modifier profondément les pratiques techniques du référencement. HTML 5 introduit en effet de nombreuses nouvelles balises décrivant des types de données.  La plus populaire d'entre elles est la balise <video> qui renvoie à la possibilité de lire des vidéos directement dans la page Web, sans avoir à passer par une technologie tierces (comme Flash).

L'introduction d'une balise pour découper les textes par thématiques

La balise <video> permet également d'indiquer aux moteur de qu'elle contient un contenu vidéo. Dans la même logique, une balise <audio> est intégrée à HTML5 pour les fichiers sons.

Aux côtés de cette nouveauté déjà largement évoquée par les analystes, l'apport le plus intéressant de la nouvelle version de HTML en matière de référencement est sans doute la balise <article>. Elle permettra de distinguer des blocs de texte au sein d'une même page Web correspondant à des thématiques différentes. 

D'autres balises viennent renforcer la capacité à structurer sémantiquement une page. C'est le cas de <section> qui définit des sous-parties au sein d'une page, ou encore <aside> qui a pour but de préciser qu'un contenu Web est lié thématiquement à celui de la page tout en étant séparé des textes principaux (typiquement il pourrait s'agir d'un encart faisant la promotion de produits ou contenus connexes). Autre exemple : <ins> qui permet de définir les parties de page qui ont été mises à jour.

Enfin, la balise <header>  (à ne pas confondre avec head) a été conçue spécifiquement pour améliorer la structure des contenus Web, et permettre aux moteurs de recherche de mieux les décrypter.

Utilisable plusieurs fois dans une même page (au début d'une section par exemple), elle pourra contenir des titres et sous-titres (h1, h2, h3), des textes, un sommaire... Le regroupement de tous ces éléments contribuera à  faciliter la lecture de la page par les robots des moteurs de recherche. La balise <footer> pouvant être utilisée de la même manière.

Dans le contenu <header>, les sites auront également la possibilité d'intégrer une balise <nav> qui fait son apparition pour désigner les liens internes. Un ajout qui pourrait se révéler au combien utile pour compléter les sitemaps, et apporter aux moteurs de nouvelles informations sur la structuration d'un site.

L'ensemble de ces nouvelles balises viendront remplacer les multiples balises <div> qui jusque là parsèment les pages, en apportant une dimension sémantique supplémentaire.