Comment fonctionne le classement Google - Le darwinisme dans les résultats de recherche

Comment fonctionne le système de classement de Google ? Comment Google décide si une SERP va contenir des éléments riches tels que la vidéo, les images, les résultats en vedette (Featured Snippet / Position0)... Gary Illyes (Google) m'a expliqué, et ça m'a complètement terrassé.


Les résultats en vedette (Featured Snippet / Position 0) sont gérés par un algorithme de classement spécifique, distinct de l'algorithme principal. En tous cas, c’était ma théorie. Et je ne suis pas le seul. Des experts tels qu'Éric Enge, Cindy Krum et Hannah Thorpe la partagent.

Pour tenter d'obtenir confirmation (ou réfutation) de cette théorie, j'ai posé cette question à Gary Illyes lors de la conférence SMS Sydney :

Le featured snippet fonctionne-t-il sur un algorithme bien distinct de celui des 10 liens bleus ?

La réponse de Gary Illies était stupéfiante. Il m'a donné (ainsi qu’à 20 autres personnes présentes dans la salle) un aperçu de ce qu'un nouvel ingénieur apprend lorsqu'il commence à travailler sur le moteur de recherche de Google.

Le système / mécanisme décrit dans cet article est confirmé et véridique, mais certaines conclusions que je tire ne le sont pas (en italique). Tous les chiffres dans cet article sont là uniquement pour illustrer - ils sont 100% inventés par moi.

Le but de cet article est de donner un aperçu du fonctionnement du classement. Je ne me prononce ni sur quels sont les signaux de classement individuels, ni leur importance relative.

Comment fonctionne le classement dans la recherche Google
          Quels sont les facteurs de classement?

Il existe des centaines, voire des milliers de signaux qui contribuent aux classements de Google. Et Google ne nous donne pas beaucoup de détails (ce qui me semble raisonnable de leur part).

Google nous donne par contre, une bonne visibilité sur la façon dont ils les regroupent : pertinence, qualité, vitesse, RankBrain, entités, données structurées, récence... et autres.

Deux points à souligner ici :
  • Ces sept facteurs de classement sont confirmés par Gary Illyes (je les présente sans ordre particulier).
  • Chaque facteur de classement comprend plusieurs signaux : par exemple, la qualité est principalement un classement PageRank mais inclut également d'autres signaux. Les données structurées incluent non seulement Schema.org, mais également des tableaux, des listes, du HTML5 sémantique et certainement quelques autres.

Pour une page A, Google calcule le score pour chacun des facteurs de classement :


N'oubliez pas que tout au long de cet article, les chiffres sont totalement hypothétiques.

Comment les facteurs de classement contribuent à l’enchère
Google prend le score de chaque facteur de classement et le multiplie pour calculer le score total (le terme "enchère" est utilisé, ce qui me semble tout à fait logique) :

Le score total a une limite maximale de 2 puissance 64… C'est certainement une référence au problème des grains de blé et del'échiquier où les chiffres figurant sur la seconde moitié de l'échiquier sont tellement énormes qu’il s’agit d’une sorte de tampon de sécurité intégrée.

Cela signifie que les scores pour chaque facteur de classement pourraient être dans les dizaines, centaines, voire même les milliers sans que le total ne puisse dépasser ce plafond.

Cette limite extrême signifie également que Google peut continuer à ajouter plus de signaux de classement et ne jamais avoir besoin de "freiner" où tamponner les signaux existants (pour laisser de la place aux nouveaux).

Jusque-là, j’étais déjà ébahi. Mais la suite de l’explication m’a laissé bouche bée !

Un seul faible score peut tuer une enchère

Le fait que l'enchère totale soit calculée par multiplication est très important. Pourquoi ? Parce qu’un seul facteur avec un score inférieur à 1 va handicaper très sérieusement l’enchère de la page, quels que soient les autres scores.


Regardez comment l’enchère chute lorsqu’un seul facteur tombe légèrement en dessous de 1. Un seul score légèrement inférieur à 1 a mis cette page hors-jeu.

Et la situation empire gravement lorsqu'un score tombe largement en dessous de 1 :

Il est possible de surmonter un score pour un facteur de classement inférieur à 1. Mais les autres facteurs devraient être extrêmement puissants.

En regardant les chiffres ci-dessus, on voit bien qu’un tel cas de "rattrapage" est certainement très (très) rare.

Leçon à retenir : ignorer un facteur faible n'est pas une bonne stratégie. Travailler pour faire en sorte que tous les facteurs soient supérieurs à 1 est une excellente stratégie.

J’imagine que les exemples de gains SEO soudains et extrêmes (que nous voyons souvent dans l’industrie du référencement) sont des cas où un site a fait dépasser un facteur de classement inférieur à 1 au-dessus de cette barre "magique".

Ce système récompense les pages qui ont de bons scores sur l’ensemble des facteurs. Les pages qui sont très fortes sur certains facteurs, mais très faibles sur d’autres sont largement handicapées. Une approche équilibrée est bien la stratégie gagnante.

"Being a straight C student is better than 3 A’s and an F" (merci à Brent D Payne pour cette analogie)

Un classement basé sur des enchères

Et les découvertes continuent !
Affiner les enchères pour un classement final

Les premiers résultats (disons les 10 premiers) sont envoyés à un deuxième algorithme conçu pour affiner le classement et supprimer tout résultat inacceptable qui a glissé entre les filets du premier calcul.

Les facteurs pris en compte ici sont différents et semblent viser des cas spécifiques.

Ce "recadrage" peut augmenter ou diminuer une enchère (ou éventuellement la laisser identique).

Il me semble que cette partie a plutôt tendance à baisser une enchère. Je vais aller plus loin et suggérer qu’il s’agit d’un filtre dont le but principal est actuellement de bloquer le contenu non pertinent, de qualité médiocre et en casquette noire que l’algorithme initial a pu omettre.

Les enchères finales pourraient ressembler à ceci :
Notez que dans cet exemple, un résultat obtient un score de zéro, et est donc totalement supprimé. Puisque Google utilise un système de multiplication, tout score individuel de zéro garantit que l’enchère globale est également zéro. Radical !Un score (et donc une enchère) de zéro peut être généré de manière algorithmique.Mon hypothèse est qu'un zéro pourrait également servir à mettre en œuvre certaines pénalités, ceci est ma conclusion et personne chez Google ne me l'a confirmée.Ce qui est certain : l’ordre change et nous avons un classement final pour le Web - les résultats des "10 liens bleus".
Jusque là, j’étais déjà étourdi mais il n’avait pas répondu à la question initiale.
La suite m’a stupéfié.
Les éléments riches suivent la même logique
Chaque type de résultats enrichis (actus, résultat en vedette, vidéo, images…) fournit son classement avec ses enchères. Ils sont, donc en compétition pour une place sur la première page de résultats pour la requête de l'internaute.
Nouvelles, images, vidéos, extraits de films, manèges, cartes, GMB, etc. - chacun est candidat pour une (où plusieurs) places sur la page 1. Chacun propose un classement avec des enchères.
Il y a déjà une grande variété d'éléments riches en compétition pour une place sur la première page de résultats…  et cette liste ne cesse de s'allonger.
Voici les exemples que Gary Illyes a utilisés :
Les facteurs de classement des candidats

Les termes "candidat" et "classement candidat" viennent de moi, pas de Google.
La combinaison de facteurs de classement qui affectent le calcul des enchères pour chaque  ‘classement candidat’ est nécessairement spécifique au type de candidat - certains facteurs lui sont propres et ne seront pas pertinents.
Par exemple, les balises <alt> s'appliquent uniquement au classement Images, et un sitemap Actualités s'appliquent uniquement au classement Actualités.
La pondération des facteurs de classement des candidats

Pour satisfaire l'internaute, l'objectif de Google est de fournir les éléments riches les plus appropriés en termes de :
  1. contenu lui-même.
  2. format du média.
  3. emplacement sur la page.

L’importance relative de chaque facteur sera également différente pour le calcul  de chaque classement candidat puisque chacun fournit un type d'informations spécifique dans un format particulier.
Par exemple, la récence va être un facteur fortement pondéré pour le classement des Actualités, et peut-être le knowledge graph pour les résultats en vedette / featured snippet.
Classement d’un candidat : calcul des enchères
Les enchères fournies par chaque candidat sont calculées de la même manière que le premier exemple de liens bleu Web (par multiplication et, je suppose, avec le deuxième algorithme de raffinement).
Google a ensuite plusieurs candidats qui enchérissent pour une place (ou plusieurs places, selon le type).Quelque chose comme ça :
Note : Avec ce système d’enchères, il n'y a pas de limite théorique au nombre d'éléments riches / candidats que Google peut introduire.
Construire la page de résultats (SERP)
La composition de la SERP dépend d’un système d’enchères
Ma question initiale portait sur un éventuel algorithme spécifique aux Résultats en Vedette, et j’ai eu ma réponse. Pour gagner une place sur la SERP, il suffit que la première enchère du classement des candidats aux résultat en vedette soit supérieure au premier du classement Web.
Pour les autres, cela n’a pas de sens. Donc, je suppose que les règles pour "gagner une place" sont différentes pour chaque type d’élément riche.
Quelque chose comme ça :

Les règles que j'ai utilisées pour faire ces choix gagnants sont fictives et non comment Google le fait vraiment.

Google recherche un résultat riche qui offrira une "meilleure" solution à l'utilisateur que le lien bleu Web. Les liens bleus Web sont la base, et pour mériter une place, un élément riche doit la gagner avec une enchère supérieure.

Lorsque Google identifie un élément riche qui est un "meilleur" résultat, cet élément se voit attribuer une place (au détriment d'un ou plusieurs liens bleus classiques).

La composition finale de la SERP (liens bleus et éléments riches)
Chaque ensemble de résultats candidats est soumis à des limitations spécifiques - et tous sont subordonnés aux liens bleus classiques Web (au moins pour le moment :).

  1. Un résultat, une position possible (résultat en vedette, knowledge graph, par exemple)

  2. Plusieurs résultats, plusieurs positions possibles (vidéos, par exemple)

  3. Plusieurs résultats, une position possible (images, actualités, carrousel, par exemple)

De mon exemple, les gagnants sont :

  1. Actualités : n’a pas battu l'enchère n°1 sur le Web. Cet élément riche n'est donc pas suffisamment pertinent pour mériter une place.

  2. Images : nous avons un gagnant. L'espace alloué est de 5, et donc les 4 autres bénéficient d’une place (cette règle est fictive et ne décrit pas la façon dont Google le fait vraiment)

  3. Vidéo : deux surenchérissent sur le meilleur résultat Web, donc ils ont tous les deux une place.

  4. Réponse en vedette : Nous avons plusieurs gagnants. Mais une seule est utilisée. Parce que c'est "la" réponse.

  5. La SERP ressemble à quelque chose comme ça.

    Je le répète: je n’ai aucune information sur la façon dont les positions sont attribuées aux vidéos ou aux images - je leur ai attribué des positions avec mon propre système simpliste inventé, et non avec celui de Google.

    Au fur et à mesure que les résultats enrichis prennent des places, les résultats en bas du classement Web tombent sur la page 2. Ce qui renforce bien le fait que la disparition continue des liens bleus va continuer, et que nos stratégies SEO doivent s’adapter en fonction.

    Ma conclusion : ‘le darwinisme dans les résultats de recherche’

    Toute cette dernière partie ce sont mes conclusions, aucunement attribuable à Gary Illyes ou à Google.


    Darwinisme dans les résultats de Google

    Il me semble que certains résultats enrichis vont "naturellement" gagner une place sur la Page 1 de plus en plus souvent (la réponse en vedette / featured snippet est un exemple d’élément riche en pleine croissance passant d’une présence sur 14% des requêtes à 18% lors de la mise à jour du 20 mars 2019).

    D'autres vont "naturellement" se réduire (liens bleus classiques sur mobile, par exemple). Certains vont même peut-être "naturellement" disparaître entièrement. Tout très darwinien!
    Ce système ne disparaîtra pas de sitôt

    Ce système d’enchères entre des éléments riches dispose d’une énorme capacité de pouvoir s’étendre et s’adapter. Organiquement!

    Nouveaux appareils, nouveaux formats de contenu, personnalisation… Peu importe les évolutions, avec ce système Google peut simplement créer un nouvel élément riche, l'ajouter au système et le laisser enchérir pour sa place. Il gagnera une place dans les résultats quand ce sera une option plus appropriée que les liens classiques en bleu. Potentiellement, avec le temps, il dominera naturellement dans le micro-moment auquel il convient le mieux.

    Le darwinisme dans les résultats de recherche Google. Génial !

    Je ne sais pas pour vous, mais je suis sur le c*l.