Le balisage sémantique pose ses jalons pour le référencement

S'adapter aux critères de vision du robot en soignant son code source : une manière de faciliter l'indexation de son site dans les bases des moteurs de recherche.

Offrir aux robots des moteurs de recherche des prises directes pour une meilleure compréhension du contenu ; c'est le rôle du balisage sémantique. Cette notion a été introduite et poussée par le W3C - le World Wide Web Consortium - qui a édité des normes pour offrir un Web plus accessible, en particulier aux personnes souffrant d'un handicap visuel.

Le rôle de ce balisage : éviter aux sites de fournir des graphismes élégants mais sans texte, ce qui aurait pour conséquences d'exclure non seulement les mal voyants, mais également les robots des moteurs.

"Le balisage sémantique ne garantit pas la visibilité. C'est une étape dans l'optimisation du site, comme l'indexation, le choix des mots-clés ou encore le netlinking", nuance Sandrine Saporta, responsable du marketing et du développement au sein de l'agence de communication interactive Ciblo.net.

En effet, les moteurs savent dans la majorité des cas comprendre le contenu d'un site pour le proposer dans les résultats d'une recherche. Cette capacité de compréhension, poussée toujours plus loin ces dernières années par les moteurs, permet justement aux annonceurs de passer outre le balisage sémantique.

080326 izzogolf
Aperçu du site Izzo.com avec Bethebot. Les images sont ignorées par les moteurs. © Izzo.com

Alors, quelle est l'utilité du balisage sémantique ? Concrètement, l'étape consiste à apporter des indications sur l'organisation du contenu afin d'expliquer son sens aux moteurs de recherche. Ce balisage permet d'ordonner son code de façon claire et d'alléger la page du "bruit" pouvant perturber les robots dans leur travail de collecte. "Une page plus légère et compréhensible permettra au site d'être mieux crawlé par les moteurs", estime Sandrine Saporta.

Pour mettre en valeur son contenu, il convient de le rédiger sous la forme sémantique structurée XHTML. Il faut également utiliser les balises "titre" <h1> à <h6>, ce qui permettra de notifier aux moteurs l'importance donnée aux titres. Il est également conseillé de préciser la langue du contenu et de donner l'encodage - ISO 8859-1 pour de l'Europe de l'Ouest, ISO 8859-15 avec le signe de l'euro - en plus ou ISO-UTF-8, pour un site accessible dans le monde - ou encore spécifier le doctype utilisé. Autant d'informations qui éviteront de tomber dans le piège des facteurs bloquants. "Ces bonnes pratiques du balisage permettent de faire gagner du temps aux robots. Si on ne déclare pas ces informations, ces derniers devront le deviner et si on le déclare mal, le site risque de grosses confusions", explique Sandrine Saporta.

"Il s'agit en fait de retraduire pour les moteurs ce qu'on a présenté aux internautes sur le front office", ajoute cette dernière. Ainsi, pour un logo affiché sur une page, il faudra le mentionner au moteur avec un attribut <alt> contenant le nom de la société.

Parmi les risques du balisage sémantique figure la sur-optimisation. "Il ne faut pas aller sur les failles des algorithmes : les moteurs savent être réactifs", considère Sandrine Saporta, "être dans l'éthique du net, ça ne coûte rien", ajoute t-elle.

Enfin, il existe quelques outils permettant de visualiser la façon dont les moteurs de recherche perçoivent les pages de son site, dont les extensions Yellowpipe Lynx Viewer et Web Developer pour mozilla, ou les sites Bethebot ou Spider-simulator.com.