Vol de contenu & plagiat : comment se protéger ?

Un ou plusieurs sites me volent tout ou une partie de mon contenu ! Que faire ? Quelles sont les conséquences pour mon site et quels sont les outils et solutions pour lutter contre cette duplication, qui peut entraîner une réelle perte de visibilité en SEO.

Un ou plusieurs sites me volent tout ou une partie de mon contenu ! Que faire ? Quelles sont les conséquences pour mon site et quels sont les outils et solutions pour lutter contre cette duplication, qui peut entraîner une réelle perte de visibilité en SEO. En effet, il arrive que des sites qui dupliquent votre contenu, se positionnent mieux que vous, car ils ont de meilleurs indicateurs aux yeux de Google.

Commençons par dire que le copier/coller d'un contenu sans l’autorisation de son auteur peut avoir des répercussions puisque la loi française protège les auteurs : les voleurs de contenus encourent une amende maximum de 300 000 euros et 3 ans d'emprisonnement.

Notons aussi que les copieurs auront des difficultés à mieux se positionner avec vos contenus, car Google a su progresser dans le décèlement des contenus originaux et des copies. Néanmoins, il arrive que le plagiaire puisse mieux remonter dans les pages de résultats que l’auteur lui-même.

Qu'est-ce que le plagiat ?

Le plagiat consiste à s'attribuer le mérite du travail d'autres producteurs de contenu. L'université d'Oxford décrit le "plagiat" comme suit :

"Le plagiat consiste à présenter le travail ou les idées de quelqu'un d'autre comme étant les vôtres, avec ou sans son consentement, en les incorporant dans votre travail sans reconnaissance complète. Le plagiat peut être intentionnel, imprudent ou involontaire."

Le contenu plagié peut également être détecté par les robots d'exploration et les bots des sites comme de la duplication de contenu.

Comment fonctionne le plagiat sur internet ?

Souvent, les copieurs prélèvent des parties d’article de différents sites Web et les combinent pour en créer un nouveau.

Ils construisent des blogs et/ou des sites à partir de ces extraits et les utilisent comme s'ils étaient les leurs. Le contenu dupliqué, publié rapidement sur des sites plus puissants en SEO que le vôtre peuvent gagner la paternité du contenu au regard de Google et se positionner devant vous.

Effets du contenu plagié

Si une partie de vos contenus ont été copiés à partir d'autres sites, il est important d’avoir à l’esprit que :

  • Le plagiat affecte la qualité du contenu
  • Google ne classera pas le contenu plagié.
  • Les moteurs de recherche savent de mieux en mieux le détecter

Malgré l’intelligence d’un moteur de recherche pour détecter des contenus plagiés, Google ne prend pas seulement en compte la détection du contenu original. D’autres critères comme la popularité, l’indice de confiance, l’ancienneté du site… peuvent donner de la légitimité au copieur et lui permettre d’acquérir la paternité du contenu. En d’autres termes, même si vous êtes à l’origine du contenu, un autre site peut se positionner devant vous avec ce même contenu.

Citations/références

Vous pouvez également éviter le plagiat en utilisant des citations et des références. Des citations complètes et correctes vous permettent d'attribuer le mérite à l'auteur. La citation de votre contenu doit s’accompagner d’un lien follow, c’est-à-dire, qui est suivi par Google, renvoyant vers la page d’où est tiré l’extrait ou la copie du contenu. Lorsque le crédit est donné, le contenu copié peut être plus acceptable.

Quels sont les outils pour le détecter ?

Pour identifier si votre contenu a été copié sur un autre site, il existe des solutions passant par des commandes sur Google à des outils de monitoring qui surveillent et détectent les sites qui dupliquent vos contenus.

Google est ton ami : Copier-coller une ou deux phrases dans la barre de recherche de Google en ouvrant et fermant votre texte

KillDuplicate : Pour automatiser la vérification, il existe l’excellent outil de Paul Sanches & Mathieu Gheerbrant qui va monitorer automatiquement votre site pour vérifier si personne ne l’aura copié en partie ou totalement. Il y a un service de mail automatique par échelon pour contacter le propriétaire du site, l’hébergeur ou faire un DMCA à Google.

Vérifier la date de publication de vos contenus

L’une des méthodes qui me semble la plus efficace reste l’utilisation de la Wayback Machine (Archive.org) qui permettra en copiant collant votre URL et celle de votre copieur de voir qui a été crawlé le premier par l’outil (et donc, possiblement par Google)

Se protéger du vol (Outils et Scripts)

Copyfight : Outil qui permet de protéger le vol de vos contenus : texte, image, … à travers un plugin WordPress. Il existe des scripts pour limiter le scraping de vos contenus ou des systèmes dans le fichier de configuration serveur anti crawling de spam Robot (sujet plus complexe)

Conclusion

Le vol de contenu sur internet est quasiment impossible à éviter. Néanmoins, 80% des affaires se règlent par un courrier envoyé par vous ou votre avocat, menaçant de poursuites, le site ou à son hébergeur. Néanmoins, il faut avoir conscience qu’une partie de votre contenu est reprise. Pour éviter cela au maximum, nous vous recommandons de mettre en place un dispositif de surveillance et d’agir en conséquence. Il existe des outils simples, mais certes payants pour vous éviter tout impact négatif sur votre visibilité. Espérons aussi que Google puisse à l’avenir encore mieux juger la paternité d’un contenu.