Les bonnes pratiques de désindexation de contenus

Dans le cadre d'une approche globale SEO, l'indexation des URLs est un KPI stratégique. Un éditeur de site aura pour objectif d'indexer un maximum de contenus dans les moteurs de recherche. Pourquoi parler de désindexation ? Pour orienter les visiteurs vers des pages qui représentent un réel intérêt et surtout prioriser une indexation "utile" des contenus que l'on souhaite mettre en avant.

La question de la désindexation d'URLs peut se poser dans différents cas de figure : refonte web, contenus obsolètes, pages non stratégiques,...autant de situations qui vont nécessiter, selon le volume de données à traiter, la mise en œuvre de directives associées à la désindexation.

Les bienfaits de la désindexation de contenus

il m'est déjà arrivé de constater sur un site à fort volume de contenus qu'un nombre important d'URLs obsolètes ou non stratégiques apparaissaient dans les pages de résultats des moteurs de recherche. Conséquence directe : un fort taux de rebond et donc une perte potentiel de trafic qualifié et/ou de conversion.
La mise en œuvre d'actions concrètes de désindexation d'URLs va améliorer la pertinence d'exploration et d'indexation de contenus de votre site.

Identifier les contenus à désindexer

Avant de lancer dans une opération "désindexation" il est prioritaire d'identifier les pages et répertoires que l'on souhaite traiter. Pour cela il faut "connaître son site" et le meilleur moyen est d'effectuer une analyse de la structure via un crawler type Xenu ou Screaming Frog ou Botify Analytics dans le cas d'un site à gros volume de contenus. A noter que Botify intègre intègre à sa solution l'analyse de logs.

Une fois la structure connue de votre site il sera plus facile de déterminer quels répertoires et URLs ne sont pas stratégiques et n'ont pas leur place dans les SERPs. Je recommande vivement de croiser les données de structure avec d'autres données analytiques : statistiques d'audience, pages en erreurs dans Google Webmaster, top/flop pages, rapport de logs, pages d'entrées et sorties sans oublier les pages qui génèrent les plus forts taux de rebond.
Ce ne sont pas les métriques qui manquent. L'objectif de cet article n'est pas de fournir une méthodologie exacte mais d'ouvrir des pistes de réflexions sur comment aborder un processus de désindexation et vers quels indicateurs d'aide à la décision on peut s'orienter.

Exemples de questions clés à se poser :
  • Quelles pages génèrent les plus forts taux de rebond et quelles en sont les raisons ?
  • Faut-il désindexer des URLs, les rediriger ou les recycler avec de nouveaux contenus
  • Est-ce pertinent de conserver des URLs pauvres en contenus et non stratégiques dans les résultats de recherche ?
  • Des fiches produits en PDF se positionnent mieux que certaines URLs dédiées à l'achat de ces produits...que faire ?
Il faut bien comprendre qu'un plan de désindexation n'est pas simplement une "action de nettoyage" mais peut parfaitement s'inscrire dans une stratégique de performances SEO.

Test de désindexation de contenus : quelles directives ?

Afin de vérifier les directives qui fonctionnent, j'ai effectué une série de tests dans le cadre de mon travail de consultant SEO pour l'agence Synodiance.
Un site de test SEO ne bénéficie pas d'un gros volume de contenus ou d'une popularité liée à son historique de liens externes reçus toutefois cela a permis de vérifier la réaction de GoogleBot quand à l'implémentation de certaines directives.