3 bonnes pratiques pour faire d'un sitemap un allié SEO

3 bonnes pratiques pour faire d'un sitemap un allié SEO Un sitemap correctement paramétré facilite le crawl de certains sites ou contenus… Découvrez les règles à respecter pour cela.

Dans cette jungle qu'est le Web, le sitemap est un moyen efficace pour un site de capter l'attention des moteurs de recherche. La présence de ce protocole qui intègre les URLs internes d'un site n'est pas une obligation mais elle est souvent indispensable pour aider les robots de Google et cie à recenser les nouvelles pages ainsi que leurs mises à jour. 

1. Savoir si l'on a besoin d'un sitemap

En théorie, un site dont le maillage interne est solide et bien pensé n'a pas besoin d'un sitemap pour aider les robots des moteurs de recherche à découvrir les pages qui doivent être indexées. Mais le recours à un sitemap devient indispensable dans certains cas de figure. Par exemple, pour avoir une chance de se positionner sur Google News. La recommandation officielle du géant de Mountain View aux sites éligibles est de "créer un sitemap distinct pour les contenus d'actualités" et d'y recenser tous les contenus des dernières 48 heures.

"Le sitemap aide Google à afficher des données pertinentes dans ses moteurs de recherche verticaux, comme la vidéo ou les images", précise par ailleurs Aymeric Bouillat, consultant SEO technique pour l'agence de référencement SEO Hackers. C'est donc un passage obligé pour les sites qui en contiennent beaucoup. Google indique qu'un sitemap vidéo peut être isolé des autres ou venir s'ajouter à un sitemap existant.

Autre cas, celui des sites multilingues ciblant diverses zones géographiques. Aymeric Bouillat considère qu'"un script générant un sitemap constitue une très bonne alternative" lorsque votre CMS ne vous permet pas d'intégrer de balise hreflang au code source pour indiquer à Google le pays et la langue de chaque URL de votre site Internet. Cela vous permettra de faire comprendre à Google dans quels pays chaque page a vocation à être lue.

Exemple de sitemap contenant des données hreflang : 

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  xmlns:xhtml="http://www.w3.org/1999/xhtml">
  <url>
    <loc>http://www.example.com/fr/page.html</loc>
    <xhtml:link
               rel="alternate"
               hreflang="fr-be"
               href="http://www.example.com/be/page.html"/>
  <url>
    <loc>http://www.example.com/be/page.html</loc>
    <xhtml:link
               rel="alternate"
               hreflang="fr-fr"
               href="http://www.example.com/fr/page.html"/>   
  </url>
  <url> 
</urlset>

Le sitemap sert également à aider les robots à repérer les correspondances entre les URLs mobile d'un domaine dédié : m.domaine.fr et le site principal : www.domaine.fr, comme dans l'exemple ci-dessous. C'est indispensable pour éviter qu'ils pensent avoir affaire à du duplicate content.

<url>
<loc>http://www.example.be/page-1/</loc>
<xhtml:link
rel="alternate"
media="only screen and (max-width: 640px)"
href="http://m.example.be/page-1" />
</url> 

Enfin, Google ne peut pas lire les liens dans le code source des pages en full JavaScript, sans rendu côté serveur. Il risque donc de ne pas pouvoir suivre le maillage interne du site si ce dernier en embarque beaucoup. Faille qu'un sitemap peut pallier.

2. Organiser les sitemaps d'un site

"Tous les différents sitemaps doivent être rassemblés dans un index de sitemap"

Un sitemap peut contenir jusqu'à 50 000 URLs ou 50 Mo. Inutile pour autant de tout vouloir faire rentrer dans un seul sitemap, l'intérêt de ce protocole résidant dans sa capacité à accélérer le crawl des robots car il rend l'organisation du site plus lisible. D'où l'importance d'assigner un sitemap à chaque typologie de contenus. Fabien Raquidel, consultant SEO indépendant, recommande "de découper le site avec différents sitemaps pour séparer, par exemple, les pages catégorie, produits et articles, avec du contenu, ou regrouper les pages par univers : saison, cible, type d'événement, etc." Tous ces différents sitemaps doivent être rassemblés dans un index de sitemap, "seul fichier mentionné dans le robots.txt", relève le référenceur des SEO Hackers. Cet index peut rassembler jusqu'à 50 000 sitemaps.  

3. Maintenir ses sitemaps à jour… et au bon moment

"La plupart des CMS proposent des  plugins de gestion des sitemaps"

La mission d'un sitemap ne pourra pas être menée à bien s'il doit prendre en compte un nombre croissant de redirections 301 et d'erreurs 404 ou 410. Il risque alors de perdre du crawl. Fabien Raquidel met donc en avant l'importance de "suivre ses sitemaps, surtout lorsque le catalogue bouge beaucoup". Autrement dit, si des pages sont supprimées, elles doivent également disparaître du sitemap. La plupart des CMS proposent des  plugins de gestion des sitemaps. "Sur Wordpress, Google XML sitemap ou XML Sitemap & Google News sont les plus efficaces. Yoast génère et gère aussi le sitemap mais avec beaucoup moins d'options", estime le consultant indépendant.

Aymeric Bouillat recommande toutefois d'être prudent en matière d'automatisation des sitemaps. "Les plugins ajoutent parfois des URLs inattendues dans l'index, comme des pages de test ou d'autres non pertinentes", relève-t-il. Ils risquent aussi de générer des duplications "si un fichier sitemap renvoie des URLs techniques type index.php?article =4587 et que le site utilise des URLs propres type /mon-article-4587.html sur un CMS qui n'utilise pas de canonical".

En cas de migration SEO, Aymeric Bouillat conseille à ses clients "d'attendre que Google ait recrawlé la majeure partie des 301 avant d'actualiser le sitemap, pour éviter la duplication temporaire entre la nouvelle URL et l'ancienne, pas encore recrawlée par Google." Ce serait un mauvais signal pour les robots de crawl des moteurs de recherche.

Et aussi : 

Autour du même sujet

3 bonnes pratiques pour faire d'un sitemap un allié SEO
3 bonnes pratiques pour faire d'un sitemap un allié SEO

Dans cette jungle qu'est le Web, le sitemap est un moyen efficace pour un site de capter l'attention des moteurs de recherche. La présence de ce protocole qui intègre les URLs internes d'un site n'est pas une obligation mais elle est...