SEO : à l'ère de l'IA générative, le nom d'auteur est-il encore plus important ?

SEO : à l'ère de l'IA générative, le nom d'auteur est-il encore plus important ? Google remet au goût du jour la paternité du contenu, avec l'EEAT notamment. Les contenus générés par l'intelligence artificielle posent de nouvelles questions.

Afin de trouver l'auteur d'un contenu, la balise rel = author, apparue il y a une dizaine d'années, a fait long feu. Depuis, beaucoup de commentaires de dirigeants de Google affirment qu'on pourrait supprimer la paternité des pages en toute sécurité. Ils auraient d'autres moyens de connaître l'auteur des articles.

Selon Olaf Klopp, co-fondateur de l'agence Aufgesang GmbH, Google peut se servir d'un large éventail de brevets. "Grâce aux développements technologiques de ces dernières années en matière d'intégration, Google est en mesure de créer des vecteurs pour les entités auteur et de les placer dans des espaces thématiques sémantiques. Cela permet d'attribuer des auteurs à des champs thématiques." Selon lui, si les entités ne sont pas capturées dans le knowledge graph, Google peut reconnaître et extraire des entités du contenu non structurées à l'aide de l'apprentissage automatique et de modèles linguistiques. La solution se nomme la reconnaissance d'entités ("Named-entity recognition" pour NER), une sous-tâche du traitement du langage naturel.

Dans l'exemple ci-dessous, "Olaf Klopp", "co foundeur", "head of SEO" et "Aufgesang" sont les entités nommées. Le traitement du langage naturel peut identifier des entités et déterminer la relation entre elles.

Cela crée un espace sémantique qui capture et comprend mieux le concept d'entité. L'intégration d'auteurs est ensuite liée à l'intégration de documents. Celle-ci est comparée aux vecteurs d'auteur grâce à une analyse de l'espace vectoriel. La distance entre les vecteurs de document et le vecteur d'auteur correspondant décrit la probabilité que l'auteur ait créé les documents.

Mais il existerait bien d'autres méthodes pour identifier l'auteur. "Un brevet de Google sur les vecteurs d'auteur permet de déterminer l'auteur d'un texte à partir de son style d'écriture", explique Olaf Klopp. "Mais je ne pense pas que Google soit prêt à le reconnaître." On ne sait pas comment sont utilisées toutes ces techniques et leur degré d'importance pour le géant américain.

EEAT et YMYL

Malgré les capacités supposées de Google à reconnaitre un auteur, l'intérêt de sa mention apparait toujours nécessaire dans certains cas. Afin de continuer à présenter un contenu de qualité dans ses résultats, Google demande, dans le cadre de l'EEAT, pour expérience, expertise, autorité et confiance, d'écrire ou de relire du contenu dans son domaine d'expertise. Les Search Quality Raters Guidelines évoquent aussi le fait d'identifier les auteurs et le responsable du contenu, "même s'il s'agit d'un pseudonyme ou d'un nom d'utilisateur." Cela pourrait prouver que la mention de l'auteur est encore importante pour la firme de Mountain View.

Ces mentions d'auteur peuvent être particulièrement utiles pour les sujets de type YMYL (Your Money, Your Life). "L'EEAT est surtout important pour Google dans le cas de contenus sensibles, par exemple dans le domaine de la médecine et de la santé", rappelle Christian Kunz, expert SEO chez 1&1. "A l'avenir, Google dépendra encore plus de la possibilité de reconnaître de qui proviennent les contenus et si l'auteur est digne de confiance."

Pour montrer la paternité d'un contenu, "si les pratiques comme ajouter le nom de l'auteur, son poste, une mini-biographie, sa photo, ou la date ne sont pas nouvelles, elles semblent s'accorder parfaitement avec les critères EEAT de Google, qui viennent récompenser les contenus experts et originaux, notamment", assure "également Gauthier Giffon, consultant SEO chez Invox. "Ils ont, selon moi, une importance de plus en plus forte pour être Google friendly. De plus, la production de contenus assistée par IA multiplie les contenus très similaires et peu originaux. Alors, si on prend la peine de faire du contenu original et recherché, autant en faire une fierté, mais aussi le protéger avec un droit d'auteur visible."

Selon Olaf Klopp, également, "une page d'auteur avec les articles écrits, des liens vers des profils de médias sociaux, ou encore des sites web est recommandé. Ainsi, Google comprendra plus rapidement qu'il s'agit d'une personne réelle avec une expertise." Pour lui, "faire connaître à Google l'auteur du contenu par les données structurées sur l'auteur n'est qu'une solution intermédiaire."

"Assumer jusqu'au bout"

La notion d'auteur reste donc au moins importante pour Google et le lecteur dans certains cas. A la question de savoir qui sera l'auteur d'un contenu généré par l'IA, le site CNET avait publié des articles générés par l'IA et revus par un éditeur discrètement signés "CNET Money Staff". Cela avait provoqué une vive réaction de la part des lecteurs qui s'en étaient aperçus. Et offert une drôle de publicité à l'organisme éditrice du contenu.

Pour autant, à quel moment peut-on signer un texte généré par l'IA et retravaillé par l'homme ? "Google lui-même dit qu'il n'exige pas que l'on signale les textes d'IA ", défend Olaf Klopp. "C'est une question d'éthique morale. Ce n'est pas une question de SEO." Pour Gauthier Giffon, "si vous avez un minimum rédigé ou participé à la production assistée par IA, je pense que vous pouvez indiquer votre nom d'auteur. Mais attention, il faut l'assumer jusqu'au bout, c'est à dire : maîtriser le sujet que vous avez rédigé avec l'IA, et surtout, être capable d'assumer qu'il l'a été si on vous le reproche ou que vous vous retrouvez avec du contenu similaire à quelqu'un d'autre. L'IA est un fabuleux outil, notamment pour assister à la rédaction, à vous de l'utiliser à bon escient et de l'assumer plutôt que de le cacher, je pense."

L'impact ?

Une récente étude a essayé d'en savoir plus sur la représentativité des pages avec un nom d'auteur dans les SERP. Effectuée sur 70 requêtes et 647 résultats de la première page du moteur de recherche de moteur américain, elle montre que 46% des résultats de la page 1 attribuaient leur contenu à un auteur. 43% des résultats du top 3 ont fait de même.

Toujours d'après l'enquête, les biographies détaillées des auteurs étaient les plus représentées. 22% des résultats de la page 1 et du top 3 en contenaient une. Viennent ensuite les liens vers les sites web personnels, les portfolios ou les profils de réseaux sociaux des auteurs. Ils apparaissent 18% du temps sur la page 1 et 16% du temps dans les 3 premiers résultats. Enfin, 11% des listes de la page 1 contenaient des liens de profil LinkedIn pour l'auteur, et 10% des listes du top 3 en avaient. Les types de contenus où l'on trouvait le plus couramment l'attribution du nom de l'auteur étaient les articles de blog, les articles invités, les communiqués de presse et les contenus originaux. 64% des sites Web de résultats de la page 1 proposaient d'ailleurs ce dernier type de contenu, d'après l'étude.