HTML 5, des balises pour la recherche sémantique

Malgré l'apparition de XHTML comme nouveau standard de balisage pour le Web, HTML 5 est en cours de développement. Le W3C a publié en janvier 2008 une première version de travail.

Malgré son adoption par le W3C qui l'a érigé au statut de recommandation, le XHTML n'en présente pas moins certaines faiblesses et incompatibilités qui ont poussés les développeurs à travailler sur une nouvelle version de HTML.

HTML 5 vise à pallier les défauts de HTML 4 et de XHTML 1. Sa version définitive est attendue d'ici 2010. 

 

HTML 5 se base sur les technologies courantes (navigateurs Web, standards utilisés...). Il intègre le référencement universel qui permet aux moteurs de recherche de proposer à l'internaute un panel de documents multimédia, et plus seulement des pages Web. Pour cela, les balises HTML 5 précisent le contenu des éléments.

 

Pour les contenus vidéo, la balise <video> remplace par exemple l'ancienne balise <object>. <poster="url"> affiche une image quand la vidéo n'est pas disponible. <audio> contient un contenu audio. Son intégration est similaire à la balise <video> avec elle aussi une forte valeur sémantique.

 

HTML 5 recentre le contenu sur la recherche universelle

 

La nouvelle version de HTML enrichit la description des informations et la thématisation des contenus. Les moteurs de recherche peuvent ainsi élargir leurs résultats à différents médias (images, audio, vidéos, actualités, localisations géographiques...).

 

<section> identifie un bloc de contenu pour structurer la page par sections thématiques. Elle peut contenir des titres (hn), des paragraphes (p), un entête (header) et/ou un pied de page (footer).

 

<article> indique un contenu indépendant de la page, par exemple un post sur un forum ou un blog. Il est possible d'imbriquer plusieurs balises <article>, dans le cas de commentaires. Son utilisation reste encore complexe et devrait être précisée dans les prochaines versions du document HTML 5.

 

<ins> indique un contenu venu compléter la version initiale du document. Cette balise fait partie des éléments de mise à jour. Les moteurs de recherche pourront reconnaître les éléments mis à niveau, leur date de modification...<figure> intègre du contenu de type prose. <legend> indique comme son nom l'indique une légende.

 

HTML 5 veut préserver la compatibilité avec HTML 4 et XHTML 1

<aside> contient un contenu en faible rapport avec la page, ou connexe. Cette section peut être séparée de la page, afin de présenter des contenus différents aux visiteurs. <nav> indique la navigation principale du site. Elle comprend les liens de navigation internes que le visiteur a à sa disposition.

 


<progress> indique le niveau d'avancement d'une tâche. <meter> contient une valeur fractionnaire ou scalaire dont on connaît l'intervalle de valeurs possibles. <dialog> met en avant une conversation, <dt> précise le nom du locuteur et <dd> ses paroles. <m> marque du texte ou le met en surbrillance.


<input> supporte d'autres types de données comme le courrier électronique, l'URL, la date, l'heure, un numéro... Les balises <frame>, <frameset>, <noframe>, déjà dépréciées depuis les dernières versions, disparaissent dans HTML 5.


Les moteurs de recherche vont devoir adapter leurs algorithmes aux changements apportés par HTML 5. Mais la précision des éléments permettra par la suite des résultats encore plus rapides et pertinents.

HTML / W3C