Olivier Andrieu (Abondance) "Google Panda introduit une nouvelle façon d'optimiser son référencement"

Avec l'arrivée de Google Panda, comment gérer le contenu dupliqué ? Quels sont les sites qui devraient pâtir, ou bénéficier de cette mise à jour ? L'expert SEO Olivier Andrieu donne ses conseils dans un ebook qui vient de paraître.

JDNSolutions. Le contenu dupliqué est visé par Panda. Quels conseils donneriez-vous aux sites qui en proposent - les e-commerçants avec leurs fiches produits par exemple ?

Olivier Andrieu. Le duplicate content, ou même le contenu spinné, est en effet exposé à être pénalisé par Panda. Dans l'idéal, il faudrait modifier ce contenu dupliqué, afin de proposer un contenu original, avec une valeur ajoutée. Mais c'est souvent plus facile à dire qu'à faire !

J'explique dans mon ebook sur Panda qu'il existe des outils pour mesurer précisément le taux de similarité entre deux pages et leur code html. Pour éviter que Google considère le contenu comme dupliqué, le taux de similarité ne doit pas excéder environ 70%. C'est bien sûr un chiffre indicatif mais, d'expérience, il se révèle souvent assez juste.

Pour certains cas, il vaudra mieux indiquer à Google (au travers de la balise link rel= "canonical" ) quelle est la page canonique entre deux pages proposant le même contenu, pour éviter que Google choisisse d'en mettre une en avant une aux dépens de l'autre.

Google prend également en compte des balises identifiant la source et l'auteur d'un contenu. Je pense qu'il faut d'autant plus les utiliser que les sites devraient de plus en plus se sémantiser, en utilisant notamment HTML5 et les standards de schema.org. Je recommande d'ailleurs vivement aux webmasters de bien être attentifs à ces deux syntaxes, qui devraient jouer un rôle important dans les mois et années qui viennent.

Enfin, il est toujours possible d'empêcher les robots de crawler et d'indexer certaines pages. Avant d'insérer la balise adéquate (meta robots "noindex"), la question qu'il faut se poser est "Est-ce que cette page possède suffisamment de valeur ajoutée pour justifier son existence dans Google ?". Si oui, elle ne devrait pas subir la colère du Panda. C'est d'ailleurs l'une des interrogations que Google avait mis dans sa liste de questions que les éditeurs de sites web devaient se poser pour savoir si leurs contenus sont potentiellement visés par Panda.

Panda permet de remettre en question certaines pratiques pourtant bien enracinées, comme celle d'indexer la grande majorité des pages d'un site.... Bref, cela introduit une nouvelle façon d'optimiser son référencement naturel.

"Des sites pourront aussi bénéficier de Panda"

Par chance pour les sites français, Panda a été déployé outre-Atlantique il y a maintenant quatre mois. Pensez-vous que Panda va faire beaucoup de dégâts lorsqu'il sera déployé en France ?

D'abord, je pense qu'il ne faut pas oublier que les sites pourront aussi bénéficier de Panda. C'est un filtre qui a été mis au point pour pénaliser les sites de mauvaise qualité, mais qui va également récompenser certaines bonnes pratiques. Beaucoup ont tendance à l'oublier !

Aux Etats-Unis, beaucoup de business model se sont basés sur une sur-optimisation du référencement en délaissant la qualité de leur contenu. C'était presque devenu une industrie. En France, cela n'a pas atteint les mêmes proportions, même si des initiatives étaient en cours. Elles ont été stoppées net avec la perspective du déploiement de Panda. Tout cela invite à penser que les répercussions seront moindres en France qu'aux Etats-Unis.

En outre, Panda vise essentiellement les aggrégateurs de contenu, les MFA, les fermes de contenus, etc. Pourtant, il y a eu des effets de bord non-négligeables : certaines bonnes pratiques SEO, qui suivaient les recommandations de Google, ont également été pénalisées. Et, à l'inverse, certains sites pressentis comme visés n'ont pas été, dans un premier temps, atteints.

Il y a d'ailleurs eu Panda, puis ses répliques 2.1 et 2.2 pour corriger ses effets de bord. Ces répliques prouvent également que Panda, vraisemblablement basé sur un système très complexe d'auto-apprentissage, est loin d'être simple à déployer. C'est sans doute aussi pourquoi, son déploiement ailleurs que dans les pays non-anglophones prend tant de temps. Et c'est également ce qui peut nous faire craindre des effets de bord comparables à ce qui s'est passé dans le monde web anglophone. Mais ils devraient être corrigés par la suite.

Outre-Atlantique, Google avait mis en place une liste de discussion pour ceux qui pensaient avoir été impactés négativement sans raisons. Il est fort probable qu'une telle procédure sera également proposée en Europe...

Justement, selon certaines théories, en partie fondées sur les travaux de recherche des ingénieurs Google, ce système d'auto apprentissage tiendrait également compte du type de site. Selon ces hypothèses, Panda n'appliquerait pas la même grille d'évaluation aux sites de e-commerce qu'aux sites de contenus éditoriaux par exemple. Cela vous semble crédible ?

Je trouverais cela assez logique, et ce ne serait pas surprenant, mais le système d'auto apprentissage est très, très complexe... et Google n'a rien confirmé à ce sujet. Mais ce sera un point très intéressant à prendre en compte lorsqu'il sera temps de faire le bilan du passage de Panda en France...

Olivier Andrieu est consultant indépendant dans le domaine du référencement naturel. Editeur du site Abondance, formateur CCMBenchmark, il a également publié plusieurs ouvrages dont notamment "Réussir son référencement Web". Après avoir débuté dans la télématique en tant qu'ingénieur, il a commencé à travailler dans le Web en 1993.

Olivier Andrieu (Abondance) "Google Panda introduit une nouvelle façon d'optimiser son référencement"

Guides

Repères