Comprendre les mises à jour & pénalités de l'algorithme de Google
Le fonctionnement de Google a beaucoup évolué depuis les 10 dernières années. Il est intéressant de s'intéresser de plus près aux bases de son fonctionnement afin de comprendre ce qu'est réellement une pénalité.
Google bot, index & algorithme
Lors du crawl d’un site internet, le Google
bot lit les différents éléments de la page (code html, texte…). Il suit
également les différents liens (internes et externes) représentant des sortes
de « route ». L’indexation est un processus complémentaire mais
totalement indépendant. Il consiste en la création d’une base de données
mettant en relation les différents documents d’un site internet avec des
groupes sémantiques repérés lors du crawl.
Si l’on empêche un document d’être crawlé via
le fichier robot.txt, il peut quand même être indexé. Par contre, il ne se sera
pas associé à un groupe sémantique – par extension, il ne sera pas accessible à
partir d’une requête. Si l’on empêche un document d’être indexé via une balise no
index, il peut quand même être crawlé – dans le cas où le Google bot suit un
lien dofollow pointant vers ce dernier document.
L’algorithme intervient lorsqu’un internaute
effectue une requête particulière sur Google. Il doit faire le tri des millions
de documents associés à une requête (et donc à un groupe sémantique déduit lors
du crawl) de sorte à afficher en premier les résultats les plus pertinents.
Pour cela, il utilise un certain nombre de règles qui sont régulièrement mises
à jour.
Pour résumé, le Google bot lit, l’index est
une base de données où sont stockés les résultats apparaissant lors d’une
requête sur Google et l’algorithme trie ces résultats selon un ensemble de règles
régulièrement mises à jour.
Les pénalités algorithmiques (à ne pas
confondre avec les pénalités manuelles) sont liées à l’ajout de filtres à
l’algorithme de classement des résultats de Google.
Les pénalités
Les pénalités manuelles
Une pénalité manuelle est une action menée par un employé de l’équipe anti-spam de Google sur un site web précis. Elle vise un problème particulier à l’encontre des critères de qualité de Google et donc par extension de son algorithme. Dans ce cas, on reçoit un message via GWT nous précisant la cause de la pénalité et son impact (le site entier ou juste une partie). Après correction de l’erreur, on peut demander un réexamen. Si l’on a fait preuve de bonne volonté pour régler les problèmes soulevés par l’équipe anti-spam de Google, la sanction est rapidement levée. Il s’agit de la pénalité la moins grave car on est prévenu, on nous informe de la cause et on peut demander un réexamen manuel contrairement à une pénalité algorithmique.
Les pénalités algorithmiques
Une pénalité algorithmique ne peut survenir qu’après le déploiement d’un filtre. Les filtres sont des éléments s’ajoutant à l’algorithme de Google et destinés à punir des sites de mauvaise qualité. Ils sont plus connus sous le nom de Panda et Penguin. Étudions de plus près ces deux filtres.
Penguin
Il s’agit du filtre le plus sévère. Ce dernier est déployé manuellement lors de ses mises à jour qui ont lieu plus ou moins tous les 6 mois. En cas de pénalité Penguin, il faut donc attendre le prochain déploiement pour que le site pénalisé soit reconsidéré par le filtre.
La bonne nouvelle : on ne peut pas être
touché par une pénalité Penguin en dehors de ces mises à jour. Si vous avez un
doute, la dernière a eu lieu en Octobre dernier. Si vous avez remarqué une
chute de votre trafic organique plus d’un mois après, il ne faut pas chercher du
côté de Penguin. La mauvaise nouvelle : il faudra attendre la prochaine
mise à jour pour sortir de la pénalité et personne ne sait quand elle aura
lieu.
Comprendre cela permet d’éloigner la piste
d’une pénalité Penguin en cas d’une baisse de trafic éloigné d’une mise à jour
du filtre. Cela permet de prendre également conscience de l’impact que peut
avoir une telle pénalité sur un business – subir une perte significative de ses
revenus issus du trafic organique de Google sur une période indéterminée. Dans
certains cas, désoptimiser son site n’est donc pas un luxe, tout comme réaliser
un audit off-page.
Panda
Le filtre Panda est déployé automatiquement
tous les mois et pas seulement lors de ses mises à jour. Cela signifie que l’on
peut sortir d’une pénalité Panda relativement rapidement si l’on agit vite.
Je n’évoque pas ici Humming Bird et Pigeon qui
ne représentent pas de réels filtres. Ce sont également des ajouts à l’algorithme
mais plus destiné à améliorer l’expérience utilisateur du moteur de recherche
et les résultats que de punir les « mauvais » sites.
Pour conclure, déterminer si l’on a été touché
par une pénalité algorithmique et en sortir est loin d’être facile. Le premier
problème étant que l’on ne sait pas, a priori par, par quelle pénalité on a été
touché et si c’est vraiment le cas. Les critères de classement des résultats
évoluent vite et la concurrence est rude. Une baisse de trafic peut traduire
l’arrivée de nouveaux concurrents où une dépréciation algorithmique qui
n’implique pas forcément une pénalité.
Par ailleurs, sortir d’une pénalité
n’est pas si rapide si l’on compte le travail plus le temps d’attente du
déploiement du filtre. Il existe des outils pour sortir d’une pénalité Penguin
comme l’outil de désaveu de Google. Mais là encore, il faut se méfier. Il doit
d’agir d’un dernier recours et le Google peut mettre jusqu’à 6 mois avant de
prendre en compte l’ensemble des liens à désavouer.
Imaginer que le déploiement
de Penguin survienne pendant ce laps de temps, il faudra attendre une autre
mise à jour pour espérer sortir de la pénalité.