Ce qu'il faut retenir des tweets de Google sur le fonctionnement de son moteur

Ce qu'il faut retenir des tweets de Google sur le fonctionnement de son moteur Le Googler Gary Illyes a publié une série de tweets instructifs sur les arcanes du célèbre moteur. Zoom sur 5 d'entre eux, avec leurs impacts sur le SEO.

Depuis la semaine dernière, Gary Illyes, Webmaster Trends Analyst chez Google, publie des tweets commençant par "DYK", pour "Did You Know", que l'on pourrait traduire par "le saviez-vous". A chaque fois, ces tweets expliquent le fonctionnement du moteur. Certains sonneront comme des évidences aux oreilles de certains spécialistes, ou comme des conseils contestables, mais d'autres pourront aussi éclairer sur des arcanes du moteur, pas toujours bien connus de tous les professionnels du web. Voici 5 de ces tweets "DYK", traduits, que l'on peut retenir. 

Profil Twitter de Gary Illyes, Webmaster Trends Analyst chez Google. © Capture

1-"Les mots clés peuvent avoir différents poids, selon là où ils se trouvent dans la page et ce qui les entoure. Le texte d'un footer pourra peser moins que celui qui est au centre"  (tweet original)

Ce n'est pas la première fois qu'il le fait comprendre (il y a déjà eu des brevets et des pénalités qui le sous-entendaient) : le moteur est tout à fait capable de distinguer le contenu principal et ce qui l'entoure. Tous les contenus d'une page web n'ont donc pas le même poids. Ce qu'il faut aussi comprendre au travers de ce tweet, c'est qu'un lien dans un footer, ou dans une colonne sur le côté, aura aussi moins d'impact en SEO qu'un lien placé dans le contenu principal, et central, d'une page.

2- "Si vous lisez à haute voix du texte sur votre page et qu'il ne sonne pas naturel, cette partie du texte pourra peser beaucoup moins dans le classement" (tweet original)

Ce tweet en dit long sur la compréhension actuelle du langage naturel par le moteur. Il s'agit là de l'un des domaines de prédilection de l'intelligence artificielle et du machine learning – des sciences de la données qui constituent l'une des plus grandes priorités stratégiques affichées de Google, qui brille aussi beaucoup dans ce domaine… Le tweet invite à ne pas négliger la qualité, la spontanéité et la fluidité des textes à référencer. Il fustige aussi implicitement les contenus générés automatiquement...

3- "Google n'a pas de pénalité contre le contenu dupliqué, mais avoir plusieurs URL servant le même contenu va gêner le crawl et diluer les signaux"  (tweet original)

Ici, Gary Illyes Google joue un peu avec les mots, au risque d'ailleurs ne pas faire comprendre l'essentiel. Car bien sûr, le contenu dupliqué est à proscrire puisqu'il peut gêner le référencement des pages sur lesquels il se trouve. Qu'il n'y ait pas un algorithme spécialement imaginé pour pénaliser directement le contenu dupliqué, peut-être, mais il y peut bien y avoir des sanctions liées à la duplication de contenu, comme ont pu l'observer, depuis longtemps, de nombreux professionnels. "Du contenu dupliqué peut subir différent traitements : être désindexé, être moins souvent crawlé, être déclassé, être placé dans un index secondaire plus rarement interrogé", peut-on ainsi, par exemple, lire sur le site de l'agence Oseox. D'ailleurs, même dans ses consigne officielles, Google admet se réserver le droit "d'apporter les ajustements appropriés dans l'indexation et le classement des sites" en cas de contenu en double.

4-"Google a publié une version mise à jour des consignes adressées à ses Search Quality Raters. Si vous vous ennuyez, voici le lien" (tweet original)

Le PageRank est encore utilisé, mais il ne s'agit que d'un critère parmi beaucoup d'autres

Pour ceux qui ne le savent pas, les "Quality Raters" sont des personnes indirectement employées par Google pour juger et qualifier les résultats de ses pages. Leurs notes servent ensuite à améliorer les résultats. Selon certains experts, elles nourrissent ensuite les systèmes d'apprentissage automatique intégrés au moteur, comme ceux ayant servi à mettre au point Penguin ou Panda.

Pendant longtemps, Google n'a pas vraiment évoqué l'apport des Quality Raters. Mais cela a changé fin 2015, lorsque le moteur a décidé de mettre en ligne un document contenant les consignes qui leur étaient adressées. C'est ce que pointe Gary Illyes. Il se peut toutefois que le document cité soit incomplet, ou pas le plus récent. Attention, Il est assez épais : c'est pour cela que Gary Illyes précise qu'il vaut mieux avoir du temps devant soi... (sinon lire ce résumé : Quality Raters : ce que Google demande désormais à ceux qui évaluent ses résultats)

5- "18 ans après, nous utilisons toujours le PageRank (avec des centaines d'autres signaux) pour classer les résultats. Vous voulez savoir comment cela fonctionne : voici le lien" (tweet orignal)

Le PageRank est un algorithme essentiel du moteur, qui va aider à mesurer l'importance des pages en fonction des liens qui pointent vers elles. Son nom vient de Larry "Page", le co-fondateur de Google, mais ne fait pas référence à une "page" Web… D'ailleurs, dans son tweet, Gary Illyes pointe vers un article scientifique rédigé par Larry Page et Sergey Brin expliquant le fonctionnement, basé sur les liens, de Google. Si Gary Illyes admet que le PageRank est encore utilisé, il en profite aussi pour dire qu'il ne s'agit que d'un critère parmi beaucoup d'autres…

Google / Twitter