SEO : Google dévoile sa lutte contre le spam

SEO : Google dévoile sa lutte contre le spam Le moteur de recherche a publié plusieurs informations sur les nombreux types de spams visés, ainsi que les actions manuelles entreprises chaque mois depuis près de 10 ans.

Dans un nouvel élan de transparence, Google a mis en ligne plusieurs informations sur le fonctionnement de son moteur au sein d'une rubrique appelée "les dessous de la recherche".  

C'est plus précisément sur une page appelée "Lutte contre le spam", que Google commence par détailler les différents types de spam que son moteur cherche à pénaliser. Cloaking, texte caché et accumulation de mots clés, liens artificiels redirigeant vers un site, liens artificiels depuis un site, DNS dynamiques gratuits générant du spam, contenu peu informatif à valeur ajoutée faible ou nulle : autant de termes et techniques définis par Google sur cette page.  

Derniers sites supprimés des résultats, et pénalités manuelles 

Mountain View y montre aussi des "captures d'écran de spam en temps réels". Il s'agit d'exemples de sites que Google vient de pénaliser en les supprimant de ses résultats de recherche. Il s'agit de "spam à l'état pur" et de sites utilisant des "techniques de spam agressives", précise le moteur.

Toujours sur la même page, Google admet cependant que si ses algorithmes "permettent de résoudre la majeure partie du spam", son moteur doit aussi traiter manuellement d'autres types de spam. C'est-à-dire aussi pénaliser des sites, non pas de manière automatisée, mais après une vérification humaine. Le moteur en profite pour lever le voile sur "le nombre d'actions manuelles" entreprises par mois depuis 2004, et sur le type de spam concerné par ces pénalités. Un instructif graphique montre ainsi l'évolution de ses actions manuelles contre les liens factices, les domaines parqués ou le cloaking.

A noter que sur la version anglaise du site, "How Search Works" propose aussi une belle infographie interactive en HTML5 montrant comment Google parcourt le Web pour indexer les pages puis les classer, mettant en avant certains critères importants dans l'algortithme.