QUESTIONS REPONSES
Sommaire Moteur-Référencement 
Le duplicate content : la bête noire des moteurs
Comment éviter de générer du contenu dupliqué sans le savoir ? Quels risques prend-on en cas de tricherie démasquée ? Décryptage.   (14/03/2007)
  En savoir plus
 Le Trusted feed : un référencement basé sur la confiance
 40 conseils pour le référencement
Qu'est-ce que le Duplicate Content ?
Le duplicate content, en français "contenu dupliqué", est la reproduction d'un contenu d'une page sur une autre. Les pages concernées sont celles présentant des URL différentes et un contenu similaire ou trop approchant pour relever de la pure coïncidence.

Ces contenus dupliqués peuvent être volontairement créés afin de maximiser les chances de ressortir dans les moteurs de recherche. Cette action déroge ainsi aux règles des moteurs, qui interdisent de spammer leur index. Néanmoins, dans la plupart des cas, le duplicate content est réalisé sans réelle intention de tricher. Les moteurs de recherche, dans un souci de qualité de leurs résultats, sont à l'affût de ces pages.

Comment le duplicate content se présente-t-il le plus fréquemment ?
La forme la plus répandue de duplicate content consiste en des pages ayant un contenu pourtant différent mais présentant des balises "titre" et "description" similaires.

Autre forme fréquente du phénomène : lorsqu'un texte se présente en version Web, en version imprimable, en PDF ou encore en Word. Chacune de ces URL sont des copies conformes en termes de contenu pour les moteurs.

Phénomène de duplication qui touche les groupes internationaux : les sites destinés à des pays différents mais utilisant la même langue. L'anglais est parlé au Royaume-Uni, en Irlande, aux États-Unis, au Canada ou encore en Nouvelle-Zélande. Le français s'exporte en Belgique, au Canada ou encore en Suisse. Si des versions de sites sont créées dans chaque pays, il est nécessaire de différencier chacune d'entre elles en termes de contenu, sous peine de subir les foudres des moteurs.

Le Duplicate Content est sanctionné par les moteurs
Enfin, la syndication de contenu entre également dans la catégorie duplicate content, obligeant les détenteurs de sites à surveiller et protéger leurs différents contenus.

Comment est-il repéré par les moteurs ?
Google et Yahoo sont deux moteurs précurseurs dans la détection du duplicate content. Ces deux moteurs majeurs ont d'ores et déjà déposé un brevet. Celui de Google vient d'ailleurs d'être validé en début d'année (lire la brève Le duplicate content de Google breveté du 08/01/2007).

Les moteurs gardant jalousement leur algorithme, il est difficile de connaître la méthode et les critères servant à définir la présence d'un duplicate content.

Quels sont les risques liés au duplicate content ?
Les conséquences d'un contenu dédoublé peuvent être lourdes pour un site. Lors de l'indexation des pages dans leur index, les moteurs détectent via le filtre de duplicate content les pages similaires et choisissent de n'indexer qu'une seule de ces sources. Ce choix automatique n'est pas forcément le meilleur pour le site.

Par ailleurs, si les moteurs détectent un abus volontaire de contenu dupliqué, ils peuvent appliquer les sanctions existantes en cas de spam de leur index, à savoir une pénalité dans le classement, voire une suppression temporaire de leur index.

Comment éviter de générer du contenu dupliqué ?
En cas de contenu dédoublé, il suffit de préciser directement aux moteurs quelles pages ne pas indexer. Trois actions peuvent être appliquées : utiliser le fichier "robot.txt", mettre en place une règle "no follow" ou utiliser la redirection 301.
  En savoir plus
 Le Trusted feed : un référencement basé sur la confiance
 40 conseils pour le référencement

Enfin, dans le cadre de la syndication de contenu, il est nécessaire de mettre en place une veille active afin de vérifier si les sites ayant repris le contenu ont bien indiqué le site original.

Emmeline RATIER, JDN Solutions Sommaire Moteur-Référencement
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters