WordPress SEO : l'extension pour doper le référencement d'un site Règles d'indexation : bien choisir les contenus référencés

daniel roch, l'auteur du guide, est consultant en référencement naturel et sur
Daniel Roch, l'auteur du guide, est consultant en référencement naturel et sur le CMS WordPress. Il est aussi connu pour son site SeoMix. © D. Roch

Il est possible de demander aux moteurs de recherche de ne pas indexer certains types de contenus, à savoir :

 les sous-pages pour toutes les archives et taxonomies (autrement dit la pagination) ;

 les pages d'auteur ;

 les pages par date ;

 les pages de catégorie ;

  les pages de mots clés.

Attention : cette rubrique est à prendre avec précaution car elle dépend du type de contenu que vous avez sur votre site et de ce que vous voulez mettre en avant dans votre référencement naturel. De même, il est possible que ces pages n'existent pas et ne soient pas accessibles dans votre thème.

Le fait de choisir de les indexer ou de les désindexer, dépend donc beaucoup de liens présents ou non vers ces contenus dans votre thème WordPress.

Le premier élément ne doit jamais être coché, à savoir l'indexation des sous-pages de pagination. En effet :

 Elles ont un intérêt pour le visiteur ;

 On peut les différencier des pages de catégorie et de mots clés (et donc éviter la duplication de contenu) ;

 Elles facilitent l'indexation des publications.

Les archives de l'auteur peuvent être désindexées ou non en fonction de vos objectifs. Avec un seul auteur, la page "A propos" suffira à mettre en avant le rédacteur principal. Si vous ne souhaitez pas mettre en avant ceux qui publient sur votre site, choisissez de les désindexer (mais pensez à enlever dans votre thème tous les liens qui pointent vers elles). 

Concernant les archives par date, elles peuvent (et doivent) être désindexées dans 95% des cas. Ne les laissez actives que dans le cas de figure où votre contenu est fortement lié à la notion de date, de période et de saisonnalité, et que cela s'en ressent dans les mots clés que vous ciblez. Sinon, cette méthode de structuration de contenu a peu d'intérêt pour l'internaute.

Pour les archives des catégories, par pitié, laissez l'indexation se faire naturellement. Il s'agit de la structure primaire de votre site, celle qui est censée être la plus pertinente et la plus voyante pour vos visiteurs et les moteurs de recherche.

Les pages de mots clés peuvent avoir un réel intérêt pour le référencement et le visiteur.

Le dernier point concerne l'indexation des archives des mots-clés, qui est sans doute le point le plus crucial du menu d'indexation, puisqu'ils peuvent entraîner de très fortes duplications de contenus.

Un grand nombre de sites conseillent de désindexer ce type de taxonomie, afin qu'ils ne servent qu'aux visiteurs pour naviguer de contenus en contenus. La question à se poser est pourtant toute bête : pourquoi donc vouloir offrir une fonctionnalité supplémentaire aux visiteurs mais pas aux moteurs de recherche ?

On prend en réalité dans ce cas le problème à revers : les pages de mots clés ont un réel intérêt pour le référencement et le visiteur, à condition de choisir avec parcimonie ces termes et d'y présenter les articles de manière différente par rapport aux catégories. Ce dernier point dépend cependant de votre thème.

Laissez donc l'indexation de vos pages de mots clés se faire de la manière la plus naturelle possible, et n'activez pas leur désindexation !

les archives par date et par auteur peuvent être déactivées
Les archives par date et par auteur peuvent être déactivées © Capture - Guide d'Abondance

Paramètres d'archive

On peut ici désactiver purement et simplement les archives par date et par auteur. Honnêtement, même si on peut comprendre parfaitement l'idée sous-jacente de ces options, il ne vous servira à rien de les désactiver si votre thème continue à afficher des liens vers elles. Oubliez donc cette partie.


 

Concernant l'indexation, lire aussi les fiches pratiques SEO du JDN :

Empêcher l'indexation d'un site miroir (un sous-domaine) via le fichier robots.txt