Fusion des données structurées & SEO : est-il possible d'en profiter ?

Fusion des données structurées & SEO : est-il possible d'en profiter ? Google permet désormais la fusion ou la liaison de différentes syntaxes de données structurées. Mais attention à la fragilité de la structure installée.

Les données structurées sont des morceaux de code qui aident Google à comprendre la structure d'une page web, son contenu et différents éléments qui la composent. Invisible pour l'internaute bien que présent dans la page web, ce langage commun permet au webmaster d'interagir plus facilement avec le moteur de recherche. En SEO, les données structurées favorisent l'exploration, l'indexation et l'affichage des pages dans un site. Elles peuvent afficher des résultats enrichis dans les SERP, comme des images ou des avis. Leur mise en place peut se faire avec un développeur ou à l'aide d'outils spécifiques, comme des plugins pour un CMS.

Pour écrire ces données, trois formats sont adaptés à Google : JSON-LD, les microdonnées et le format RDFa. "En général, Google recommande d'utiliser JSON-LD pour les données structurées si la configuration de votre site le permet, car il s'agit de la solution la plus simple à mettre en œuvre et à gérer à grande échelle pour les propriétaires de sites Web (en d'autres termes, la moins susceptible d'entraîner des erreurs des utilisateurs)", précise la firme de Mountain View. Notons que le format JSON-LD est une notation JavaScript intégrée dans une balise <script> dans les éléments < head> et <body> d'une page HTML. Les microdonnées constituent une "spécification HTML ouverte à la communauté et utilisée pour imbriquer des données structurées dans un contenu HTML" et les RDFa constituent une "extension HTML5 qui accepte les données associées en introduisant des attributs de balises HTML."

Les différents formats de données structurées en question

Cependant, la compréhension de ces données peut amener quelques soucis, notamment si différents formats sont utilisés sur la page. "La raison pour laquelle ce problème s'est posé est qu'il existe de nombreux sites web sur lesquels flottent des éléments de balisage distincts. Il peut être très difficile de savoir comment ces éléments s'intègrent les uns aux autres, ce qui conduit Google à en ignorer une partie", explique Jarno Van Driel, structured data consultant. "Les plateformes d'évaluation et les informations qu'elles partagent avec leurs clients sont un exemple concret. Il peut arriver que des fournisseurs d'avis tiers fournissent leurs avis via javascript, qui ajoute des balises HTML et microdata à une page, sans tenir compte de la syntaxe de balisage utilisée par le client. Il se peut également que les évaluations d'un produit soient en microdonnées, alors que le produit lui-même a été défini en JSON-LD. Et sans lien entre les deux, il peut être impossible de savoir à quelle entité appartiennent les avis, le produit, le vendeur ou une autre entité."

Pour faire face à ce problème, "jusqu'à présent, il valait mieux tout encoder correctement d'un coup pour être sûr que tout soit relié derrière par Google et non traité séparément", développe Mathieu Doubey, manager du pôle SEO chez l'Agence WAM.

Fusion pour plus d'efficacité

Afin de résoudre cela, Google a annoncé lors de l'événement Google Search Central du 24 octobre dernier que la fusion ou la liaison de différentes syntaxes aurait désormais lieu. Cette mise à jour est motivée par le besoin de connecter des balisages générés par différentes bibliothèques ou plugins. Elle doit offrir plus de souplesse et d'efficacité dans la gestion des données structurées sur les pages Web. 

Cette étape franchie par Google signifie que le petit pourcentage de sites qui souffrent de cette situation a désormais la possibilité de connecter des éléments qu'ils n'étaient pas en mesure de connecter auparavant. "Cette solution est destinée à ceux qui n'ont pas d'autre choix que de connecter plusieurs syntaxes. C'est une solution de contournement pour des problèmes autrement insolubles", explique Jarno Van Driel.

"L'idée est de faciliter la vie des webmasters", livre Mathieu Doubey. "On peut désormais se servir des éléments présents dans une page pour les encoder directement "On peut commencer un encodage avec des microdatas et terminer en JSON-LD ou inversement, en fonction de ce qui arrange les développeurs pour l'implémentation. Si l'on prend l'exemple des produits en e-commerce, il est possible de se servir des éléments HTML affichés dans la page pour les encoder en microdata, comme les images, le nom du produit, ou encore le prix, avec des éléments "itemprop" appropriés. Et on peut mettre en format JSON-LD le type de donnée structurée qu'on veut travailler. Ensuite, Google se charge de reconstituer le tout, pour comprendre que tout est lié à un produit.". Pour lui, "c'est plus une évolution qu'une fonctionnalité en soi. Côté SEO, a priori, cela revient au même, au niveau de la bonne prise en compte par Google. Avec un bémol quand même, lié au fait que cela complique le traitement par Google."

Gare à la fragilité de l'assemblage

Attention toutefois, Google lui-même conseille d'utiliser cette fonctionnalité avec prudence. "La raison la plus importante est qu'il s'agit d'une solution fragile", souffle Jarno Van Driel. "La situation est souvent due à plusieurs parties distinctes d'un site qui ne fonctionnent pas ensemble. Cela signifie que si l'une de ces parties est mise à jour et apporte des modifications imprévues à son balisage, votre graph peut "s'effilocher" sans que vous ne vous en rendiez compte. Cela peut également se produire à la suite d'une simple modification d'un élément du code HTML, entraînant un changement de l'ordre du DOM et donc des relations exprimées en Microdata ou RDFa via les annotations HTML."

"Laisser la main aux personnes qui éditent le code HTML qui structure les pages, hors JSON-LD (souvent relié à une extension Wordpress), induit qu'ils peuvent ajouter des éléments qui vont entrer en conflit avec ce qui est présent dans le JSON-LD, par exemple", renchérit Mathieu Doubey. "Cela ajoute aussi potentiellement des erreurs de contributions. Donc, il faudra être prudent et tester les encodages via https://validator.schema.org/ ou https://search.google.com/test/rich-results?hl=fr".

D'ailleurs, s'il a le choix, il reste convaincu que "plus on facilite la vie à Google, mieux c'est. Donc, à mon sens, mélanger les types d'encodage reste une mauvaise idée : il vaut mieux tout lui spécifier de la même façon.". Jarno Van Driel conseille aussi, pour ceux qui le peuvent, d'essayer de conserver le balisage dans une seule syntaxe. "Prévenir les situations trop complexes est souvent la voie la plus sage."