Comprendre les mises à jour & pénalités de l'algorithme de Google

Le fonctionnement de Google a beaucoup évolué depuis les 10 dernières années. Il est intéressant de s'intéresser de plus près aux bases de son fonctionnement afin de comprendre ce qu'est réellement une pénalité.

Google bot, index & algorithme

Lors du crawl d’un site internet, le Google bot lit les différents éléments de la page (code html, texte…). Il suit également les différents liens (internes et externes) représentant des sortes de « route ». L’indexation est un processus complémentaire mais totalement indépendant. Il consiste en la création d’une base de données mettant en relation les différents documents d’un site internet avec des groupes sémantiques repérés lors du crawl.
Si l’on empêche un document d’être crawlé via le fichier robot.txt, il peut quand même être indexé. Par contre, il ne se sera pas associé à un groupe sémantique – par extension, il ne sera pas accessible à partir d’une requête. Si l’on empêche un document d’être indexé via une balise no index, il peut quand même être crawlé – dans le cas où le Google bot suit un lien dofollow pointant vers ce dernier document.
L’algorithme intervient lorsqu’un internaute effectue une requête particulière sur Google. Il doit faire le tri des millions de documents associés à une requête (et donc à un groupe sémantique déduit lors du crawl) de sorte à afficher en premier les résultats les plus pertinents. Pour cela, il utilise un certain nombre de règles qui sont régulièrement mises à jour.
Pour résumé, le Google bot lit, l’index est une base de données où sont stockés les résultats apparaissant lors d’une requête sur Google et l’algorithme trie ces résultats selon un ensemble de règles régulièrement mises à jour.
Les pénalités algorithmiques (à ne pas confondre avec les pénalités manuelles) sont liées à l’ajout de filtres à l’algorithme de classement des résultats de Google.

Les pénalités

Les pénalités manuelles

Une pénalité manuelle est une action menée par un employé de l’équipe anti-spam de Google sur un site web précis. Elle vise un problème particulier à l’encontre des critères de qualité de Google et donc par extension de son algorithme. Dans ce cas, on reçoit un message via GWT nous précisant la cause de la pénalité et son impact (le site entier ou juste une partie). Après correction de l’erreur, on peut demander un réexamen. Si l’on a fait preuve de bonne volonté pour régler les problèmes soulevés par l’équipe anti-spam de Google, la sanction est rapidement levée. Il s’agit de la pénalité la moins grave car on est prévenu, on nous informe de la cause et on peut demander un réexamen manuel contrairement à une pénalité algorithmique.

Les pénalités algorithmiques

Une pénalité algorithmique ne peut survenir qu’après le déploiement d’un filtre. Les filtres sont des éléments s’ajoutant à l’algorithme de Google et destinés à punir des sites de mauvaise qualité. Ils sont plus connus sous le nom de Panda et Penguin. Étudions de plus près ces deux filtres.

Penguin

Il s’agit du filtre le plus sévère. Ce dernier est déployé manuellement lors de ses mises à jour qui ont lieu plus ou moins tous les 6 mois. En cas de pénalité Penguin, il faut donc attendre le prochain déploiement pour que le site pénalisé soit reconsidéré par le filtre.

La bonne nouvelle : on ne peut pas être touché par une pénalité Penguin en dehors de ces mises à jour. Si vous avez un doute, la dernière a eu lieu en Octobre dernier. Si vous avez remarqué une chute de votre trafic organique plus d’un mois après, il ne faut pas chercher du côté de Penguin. La mauvaise nouvelle : il faudra attendre la prochaine mise à jour pour sortir de la pénalité et personne ne sait quand elle aura lieu.
Comprendre cela permet d’éloigner la piste d’une pénalité Penguin en cas d’une baisse de trafic éloigné d’une mise à jour du filtre. Cela permet de prendre également conscience de l’impact que peut avoir une telle pénalité sur un business – subir une perte significative de ses revenus issus du trafic organique de Google sur une période indéterminée. Dans certains cas, désoptimiser son site n’est donc pas un luxe, tout comme réaliser un audit off-page.

Panda

Le filtre Panda est déployé automatiquement tous les mois et pas seulement lors de ses mises à jour. Cela signifie que l’on peut sortir d’une pénalité Panda relativement rapidement si l’on agit vite.
Je n’évoque pas ici Humming Bird et Pigeon qui ne représentent pas de réels filtres. Ce sont également des ajouts à l’algorithme mais plus destiné à améliorer l’expérience utilisateur du moteur de recherche et les résultats que de punir les « mauvais » sites.
Pour conclure, déterminer si l’on a été touché par une pénalité algorithmique et en sortir est loin d’être facile. Le premier problème étant que l’on ne sait pas, a priori par, par quelle pénalité on a été touché et si c’est vraiment le cas. Les critères de classement des résultats évoluent vite et la concurrence est rude. Une baisse de trafic peut traduire l’arrivée de nouveaux concurrents où une dépréciation algorithmique qui n’implique pas forcément une pénalité.
Par ailleurs, sortir d’une pénalité n’est pas si rapide si l’on compte le travail plus le temps d’attente du déploiement du filtre. Il existe des outils pour sortir d’une pénalité Penguin comme l’outil de désaveu de Google. Mais là encore, il faut se méfier. Il doit d’agir d’un dernier recours et le Google peut mettre jusqu’à 6 mois avant de prendre en compte l’ensemble des liens à désavouer.
Imaginer que le déploiement de Penguin survienne pendant ce laps de temps, il faudra attendre une autre mise à jour pour espérer sortir de la pénalité.