Le vocabulaire pour comprendre le SEO

Le vocabulaire pour comprendre le SEO Termes techniques, acronymes... Pour comprendre le référencement, ses acteurs et son jargon, voici la définition des termes clés aujourd'hui utilisés dans le SEO.

 
LISTE DES DÉFINITIONS - CLIQUEZ SUR LE TERME POUR LE DÉFINIR
Source : JDN
- Ancre - CTR - Not provided - SEO on-page
- Annuaire - EMD - PageRank - SERP
- Authorship / Author Rank - Liens nofollow - Panda - SMO
- Backlink - Linkbuilding - Pénalité manuelle - Spam
- Balises - Hn (H1, H2, H3...) - Penguin - SpamCo
- Black Hat SEO - Matt Cutts - Rich Snippet - Splog
- Blast - Meta description -Robots.txt - Trafic organique
- Cloaking - MFA - SEA - Une 301
- CP - Negative SEO - SEM - URL Canonique
- Crawl - Netlinking - SEO  

 Ancre. L'ancre d'un lien est le texte du lien sur lequel on peut cliquer.


 Annuaire. Site ou service d'un site listant d'autres sites web. L'un des plus connus, à cause de son ancienneté, est Dmoz. Certains SEO peuvent avoir l'habitude d'inscrire sur ces annuaires les sites sur lesquels ils travaillent pour obtenir, souvent facilement, un backlink. Mais attention, bon nombre de ces annuaires n'apportent pas des backlinks efficaces, et certains d'entre eux ont même pu être pénalisés par Google (lire notre article SEO : les critères pour choisir les annuaires efficaces).  

 Authorship / Author Rank. Il est possible d'insérer dans le code source des pages web une "balise auteur" associant le contenu de la page à un auteur (et son profil Google+). Attribuer ainsi un contenu à un auteur correspond à ce qu'on appelle l'authorship. C'est aussi ce système qui a permis, pendant plusieurs années, de voir les photos des profils Google+ dans les résultats remontés par Google. Mais le moteur a mis fin à cette pratique en juin 2014. Quelques semaines plus tard, c'est tout le système de l'authorship que Google a abandonné : cette balise auteur n'intéresse désormais plus son moteur. Des référenceurs avaient imaginé, s'appuyant sur l'interprétation de plusieurs déclarations de Google, que le moteur puisse largement intégrer ce système d'authorship dans son algorithme. Ils s'attendaient même à voir Google doper la visibilité des contenus des profils les plus pertinents : c'est la thèse dite de "l'author rank", qui a perdu l'un de ses meilleurs arguments lorsque Google a mis fin à l'authorship. 


  Backlink (parfois surnommé "BL" ou traduit en "lien entrant"). C'est l'anglicisme utilisé pour parler d'un lien pointant vers une page, depuis la page d'un autre site. Avoir de bons "backlinks", issus de sites d'autorité par exemple, est un objectif important pour les SEO. Les obtenir constitue même un peu le "nerf de la guerre" en référencement, car ils ont un poids considérable dans l'algorithme des moteurs. 

Balises. Dans le jargon SEO, les balises renvoient à certaines balises HTML, qui sont visibles dans le code source des pages web. Elles peuvent mettre un texte en gras, en intertitre, en lien, etc. Les balises d'ouverture (par exemple <title>) doivent précéder des balises de fermeture (</title>). Les balises sont au centre du langage HTML, mais aussi du travail de SEO "on page" (voir balises Hn et title).



  Black Hat SEO (parfois réduit à Black Hat voire à "BH"). Désigne des techniques en matière de référencement, mais aussi ceux qui les pratiquent. De manière un peu réductrice, les Black Hat SEO sont les référenceurs qui ne respectent pas les consignes des moteurs (et notamment celles qu'expose Google). Volontiers expérimentateurs, ils jouent avec ces règles, et essayent de trouver et exploiter des failles dans les algorithmes des moteurs. Ils cherchent aussi souvent à automatiser certaines tâches du SEO (comme le netlinking) au moyen de logiciels dédiés, et savent que leur pratique peut conduire à des résultats spectaculaires tout comme à de sévères pénalités. Ils s'opposent aux référenceurs respectant les consignes de Google, appelés eux les White Hat SEO (lire aussi : 20 techniques de Black Hat SEO).

 Blast. Terme anglais plutôt utilisé par des SEO Black Hat pour désigner une génération massive et automatisée de backlinks, avec l'aide d'outils dédiés comme ceux de cette sélection : "Six logiciels de référencement black hat".

 Cloaking. Technique consistant à présenter une page différente aux robots des moteurs et aux internautes. La technique étant trompeuse et souvent utilisée pour manipuler l'algorithme, elle expose le site à des pénalités de Google. 

 CP. Abréviation de "communiqué de presse" qui est souvent utilisée pour évoquer en fait les "sites de CP" - c'est-à-dire les sites pouvant accueillir et diffuser des communiqués de presse. Bien souvent, ces sites ne sont en fait jamais consultés par des journalistes, et n'ont été créés qu'à des fins de SEO. En effet ils permettent aux référenceurs d'obtenir des backlinks car ils peuvent y diffuser des pseudo communiqués incluant des liens pointant vers les sites dont ils travaillent le SEO. Mais là encore attention, beaucoup de ces sites de CP ont subi des pénalités de Google, et, comme ceux des annuaires, les liens issus de ces CP ont bien souvent vu leur cote chuter.


 Crawl. Anglicisme se rapportant à l'exploration des pages et leur code source réalisée par des robots, en général ceux des moteurs de recherche, ou d'autres outils qui les imitent. Le terme s'emploie comme un verbe (Google "crawle" un site) ou comme un substantif (le crawl d'un site). Pour décrire les étapes de fonctionnement du moteur de Google, on peut dire que le crawl précède l'indexation, qui précède l'affichage des résultats.

 CTR. Vient de Click-Through Rate, et se traduit par "taux de clic". C'est le rapport entre le nombre de clics et le nombre d'impressions. Si un site est apparu 100 fois dans une page de résultats sur une requête (soit 100 impressions), et que les internautes ont cliqué 10 fois dessus, le "CTR" est donc de 10%. Le terme apparaît notamment dans Google Webmaster Tools.


 EMD. Acronyme de Exact-Match Domain utilisé pour évoquer les noms de domaine qui correspondent exactement à la requête visée. Le domaine "voiture-pas-cher.com" est un EMD qui a pour but de remonter sur la requête "voiture pas cher".

 HN et H1, H2.... Une page Web peut être découpée en plusieurs parties. Les balises dites "Hn" (pour H1, H2, H3,...) vont couper, titrer et hiérarchiser ces parties. Ainsi, H1 correspondra au titre le plus important et H6 au moins important. Ces balises ont aussi un poids en SEO. 


  Liens nofollow. Si un lien normal est "dofollow", un lien "nofollow" donne une indication aux robots des moteurs de recherche, leur demandant de "ne pas suivre" ce lien lorsqu'ils parcourent la page. Google ou Bing sont censés respecter cette consigne, et donc ne pas tenir compte de ce lien dans leur algorithme. Les liens nofollow ne transmettent donc pas de PageRank. Leur usage est recommandé au sein de contenu acheté pour ne pas risquer une pénalité. Techniquement, le nofollow est une valeur de l'attribut rel, visible dans le code source d'une page (rel= "nofollow"), après la balise <a et avant le "href=" de l'URL de la page vers laquelle pointe le lien. C'est Google qui a lancé cette initiative de lien nofollow dès janvier 2005, en vue de combattre le spam. Lire aussi "Liens : quand utiliser rel="external" ou rel="nofollow" ?

 Linkbuilding. : Anglicisme signifiant la "construction de liens", et évoquant le travail consistant à obtenir de bons backlinks et donc à "bâtir" son netlinking...

 Matt Cutts est l'ingénieur qui dirige "la webspam team", l'équipe en charge de la lutte contre le webspam chez Google, en Californie. Il est très connu des SEO car il tient le rôle de porte-parole du moteur. Il réalise de nombreuses vidéos pédagogiques répondant aux questions que peuvent se poser référenceurs et webmasters. Son compte Twitter a de nombreuses fois pu annoncer les déploiements de mises à jour importantes de l'algorithme. Il est censé avoir pris quelques mois de congé.

  Méta description. La Méta description a pour but de décrire le mieux possible le contenu d'une page web en à peu près 160 caractères. Elle doit être renseignée au sein des balises HTML meta name="description". Les moteurs s'en servent car c'est aussi, bien souvent, la description de la page qui apparait sous son titre repris dans les résultats remontés.


  MFA.  Un site dit MFA pour Made For AdSense est réalisé avec l'objectif principal de le monétiser le plus et le mieux possible, grâce à AdSense donc, mais aussi via d'autres régies, l'affiliation et... le SEO. Le crédo de ce type de site : un minimum de travail pour un maximum de revenu, car la qualité du contenu d'un MFA est secondaire, ce qui compte c'est que les visiteurs cliquent sur les publicités le plus possible.


  Negative SEO. Ensemble des techniques visant à pénaliser le référencement d'un site concurrent, par exemple en faisant pointer une multitude de liens contraires aux consignes de Google vers lui en espérant que cela puisse le pénaliser. Google a reconnu l'existence du Negative SEO tout en soulignant sa rareté. Le moteur a cependant mis en place un outil de désaveu de lien pour, entre autres, empêcher de telles pratiques.

  Netlinking. Désigne à la fois l'ensemble des liens qui pointent vers un site et ses pages, et le travail qui vise à acquérir et optimiser ces liens pour améliorer le référencement.

 "Not provided". Ce terme anglais est devenu très célèbre car c'est désormais ce qu'affiche Google Analytics concernant les mots clés à l'origine du trafic venant de Google. Ce dernier a en effet décidé de chiffrer via SSL (c'est-à-dire "HTTPS") ses pages de résultats, qui ne peuvent en conséquence plus fournir (d'où le "not provided") aux outils de web analytics la requête à l'origine d'une visite. La montée en puissance de ces mots clés "not provided" a commencé en 2011. Progressive, elle a désormais atteint 100% du trafic venant des résultats naturels de Google, privant évidement les SEO d'indicateurs très précieux (les mots clés achetés via AdWords et tapés dans d'autres moteurs de recherche continuent, eux, d'apparaître). Des méthodes imparfaites existent pour essayer de récupérer les mots clés désormais "not provided", la plus efficaces étant sans doute celle consistant à regarder les données fournies par Google Webmaster Tools. 

  PageRank. Aussi surnommé "PR", il s'agit d'un indice de Google mesurant, de 0 à 10, la popularité des pages en fonction du nombre et de la qualité des liens qui pointent vers elles. Google communique un indice public pour chaque page, mais il est désormais trop rarement actualisé pour être considéré comme fiable. Le PageRank vient du nom de son créateur, Larry Page, le cofondateur de Google, et ne renvoie pas à un "classement de pages" comme sa traduction pourrait le suggérer.

 Panda est sans doute le filtre le plus connu de Google, qui le déploie régulièrement pour nettoyer ses résultats et les débarrasser de certains spams. Lancé en 2011, d'abord aux Etats-Unis, puis en France, il a provoqué un véritable séisme sur le web, réduisant presque à néant la visibilité de certains sites trop dépendants du SEO. Google a expliqué l'avoir mis en place pour pénaliser le référencement des sites "de mauvaises qualité", et a donné quelques indices pour juger de la qualité d'un site (l'absence de contenu dupliqué par exemple). Lire aussi notre article : Google Panda et Penguin, récapitulatif de toutes les mises à jour.


  Pénalité manuelle, ou action manuelle. Le premier terme est utilisé par les référenceurs, le second par Google dans son Google Webmaster Tools qui notifie ses utilisateurs lorsqu'ils sont frappés d'une telle "action manuelle". Il s'agit d'une pénalité affectant le référencement d'une ou plusieurs pages d'un site, déclenchée par l'analyse d'un employé de Google et non par un algorithme comme Google Penguin ou Panda. Parmi les pratiques SEO déclenchant le plus souvent les pénalités manuelles figurent les liens factices, c'est-à-dire les liens dofollow non naturels, résultant par exemple d'achats (lire : Ce que dit Google sur ses pénalités manuelles).

 Penguin est, comme Panda, un filtre que Google déploie de temps en temps pour nettoyer ses résultats. D'après les observations des référenceurs, il semble s'en prendre aux abus de liens artificiellement obtenus et à des pratique SEO Black Hat. Lancé dans le monde entier en 24 avril 2012, il n'a depuis été déployé qu'une poignée de fois... (lire aussi notre article : Google Panda et Penguin, récapitulatif de toutes les mises à jour).

 Robots.txt.. Fichier qui indique aux moteurs, y compris à celui de Google, ce que leurs robots ne doivent pas indexer. Il doit être placé à la racine des sites. Lire aussi notre fiche pratique "Quelle URL du sitemap mettre dans le robots.txt ?"

 Rich Snippet.  Le snippet est l'extrait de la page qui apparaît dans les résultats remontés par Google. Cet extrait peut se limiter à un titre et une description, mais il peut aussi s'enrichir (d'où le terme de "rich snippet", ou "extrait enrichi") avec des images, des vignettes de vidéo, des étoiles d'avis... Des lignes de codes peuvent être insérées dans le code source des pages pour pousser les moteurs à afficher ces "rich snippets" : ces petits bouts de code sont notamment décrits et expliqué sur le site schema.org

  SEA. Pour Search Engine Advertising. Désigne les publicités affichées par les moteurs de recherche sur leurs pages de résultats (publicités de type Google AdWords notamment) et par extension, les techniques pour les optimiser. Il s'agit donc du référencement payant, par opposition au référencement naturel (SEO).

  SEM. Le SEM (pour Search Engine Marketing) regroupe les techniques permettant d'optimiser la présence d'un site dans les résultats d'un moteur de recherche via le référencement payant et naturel. Bref, le SEM regroupe SEA et SEO (voir la définition de ce dernier ci-dessous).

  SEO. Pour Search Engine Optimisation, c'est-à-dire littéralement l'optimisation pour les moteurs de recherche. Cet acronyme tend à remplacer le terme plus long de "référencement naturel", et évoque toutes les techniques utilisées pour briller dans les résultats remontés par les moteurs de recherche comme Google. Le terme ne couvre pas le référencement payant (via AdWords par exemple) appelé lui SEA (voir ci-dessus). Le terme, à prononcer à l'anglaise ou à la française, peut aussi désigner le professionnel de ce domaine.


Seo on-page. ("SEO on-site" est parfois aussi employé). Travail SEO réalisé au sein même de la page web, et de son code source, par opposition au travail SEO qui peut être fait en dehors du site (le linkbuilding par exemple). Cela concerne donc notamment les titles et les autres balises, mais aussi les URLs, la "webperf" et toutes les optimisations faites pour améliorer le crawl des robots de Google.

  SERP. Pour Search Engine Results Page, soit la page de résultats remontés par le moteur.

  SMO. Pour Social Media Optimisation, littéralement "Optimisation des médias sociaux". Il s'agit du travail opéré sur les différents leviers proposés par les réseaux sociaux pour améliorer la visibilité d'un site ou d'une marque. Un travail qui peut parfois être celui d'un community manager, en charge de la communauté sur les réseaux sociaux.
 

 Spam. Employé par un SEO, le mot "spam" ne renvoie pas au spam qui pollue les messageries, c'est-à-dire aux e-mails non désirés, mais aux sites que Google ne désire pas voir dans ses résultats... Il s'agit des sites de mauvaise qualité, et qui, en général, ne respectent pas les consignes de Google. Le terme webspam peut aussi être préféré. Par aileurs, Même Goole Analytics peut être victime de spam - le spam de "referer".

  SpamCo. Terme mélangeant les mots "spam" et "commentaire" qui désigne les commentaires d'un contenu (en général sous un article ou billet de blog). Des commentaires qui cherchent plus à glisser un lien vers un site à référencer qu'à faire une remarque pertinente. Google en a donné un exemple caricatural très parlant.

  Splog. Terme contractant "spam" et "blog" qui désigne un blog sans aucune qualité éditoriale, souvent généré de manière automatique par des Black Hat SEO. Les splogs contiennent cependant des backlinks qui doivent pousser le référencement d'un autre site plus stratégique.

 Trafic organique.  Correspond au trafic issu des résultats naturels générés par les moteurs de recherche. Il n'inclut donc pas le trafic acheté, c'est-à-dire issus des résultats payants, via AdWords. La mission principale du SEO se concentre sur l'amélioration de ce trafic organique.

 Title. En langage HTML, l'élément ou la balise <title> définit le titre de la page. Il est en général visible tout en haut du code source d'une page. Ce titre s'affiche aussi sur les onglets des navigateurs Firefox ou Chrome. C'est bien souvent ce qu'affiche Google, en gros et en bleu, lorsqu'il fait remonter une page dans ses résultats. Le title est considéré comme un critère très important en SEO.

  Une redirection 301. C'est une redirection permanente qui correspond, techniquement, en langage informatique, au code de réponse HTTP 301. Avec "une 301", le trafic vers une page (ou URL) est automatiquement redirigé vers une autre, de manière définitive dans ce cas. L'erreur est "302" lorsque la redirection est temporaire. Lire aussi : .htaccess : mettre en place une redirection sans changer l'URL

 URL Canonique. Lorsque plusieurs URL présentent le même contenu, il est conseillé d'indiquer au moteur l'URL de référence avec le marquage HTML adéquat (rel="canonical"). Cette URL préférée, c'est l'URL canonique, celle que l'on souhaite voir indexée et apparaître dans les résultats. Google détaille la procédure à suivre pour mettre en place de telles URLs canoniques dans des pages d'aides officielles en français.