Qu’est-ce qu’un texte de qualité pour Google ?

L'IA de Google permet-elle de détecter la qualité d'un texte ou est-ce un écran de fumée ?

Nous développons toujours la chronique pour qu’un site amplifie lui-même sa puissance. Nous allons, cette fois-ci, aborder plus en détail le point 2 de la chronique sur l'amplifcation naturelle d'un site. Nous parlons de contenu, certes, mais pas forcément comme nous vous en entretenons habituellement.


Loin de moi l’idée de vouloir dire à mes amis rédacteurs comment ils doivent écrire. Chacun a son ton, son style, son expression. Je n’ai rien à dire là-dessus.

Par contre, certains tarifs me laissent perplexe. En, 2019, vous trouvez des textes à 25 euros HT pour 500 mots. Je ne pense pas que le contenu sera de qualité à ce prix. Cela sera même carrément une dépense inutile, à mon humble avis.

Votre site est précieux pour vous. Par conséquent, donnez-vous les moyens de lui créer de la valeur ajoutée.
Dans les Faits
Oui, avec de la bouillie, ça montera peut-être un peu dans Google. Pour autant, n’attendez pas beaucoup de conversions de ces pages-là. En outre, vous allez devoir faire beaucoup de pages pour compenser. Au final, votre site ne sera qu’une immense daube. (Désolé si ma franchise vous surprend dans ces colonnes.)

Honnêtement, il faut bien reconnaître que le niveau des textes sur les sites est souvent pitoyable. À force de tirer les prix vers le bas, la claque tant méritée arrive à un moment ou à un autre.

Je fais rarement commerce de rédaction de contenu. Donc, je suis relativement neutre là-dessus et j’en confère d’autant plus facilement.

Mais alors pourquoi cette chronique ?
Google parle beaucoup de qualité, mais c’est une machine. Vous devez lui donner des signaux palpables, car il n’est pas très malin. Ceux-ci portent beaucoup sur la forme. C’est sur ce point que je peux vous confier mes constats ou suppositions.

Je vous propose ici une check-list d’imperfections à éviter, car, selon moi, facilement détectables. Leurs corrections pourront faire la différence. Une page bien écrite deviendra un contenu perçu par la machine comme étant de qualité. Car oui, écrire avec le cœur ou avec ses tripes peut ne pas toujours suffire…

De toute façon, si vous êtes annonceur, ne rognez pas sur les budgets de rédaction. C’est une anomalie stratégique.
Les erreurs courantes
Check-list sans classement particulier…

– Le contenu n’est pas aéré. Il comprend de gros blocs de texte avec des phrases super longues.

=> Faire de petits paragraphes (3-4 lignes) avec des phrases courtes (15 mots maxi). Normalement, cela repose l’œil du lecteur. Google doit savoir qu’en faisant cela, vous avez pensé que vous serez lu. Notez que scinder une phrase en deux nécessite souvent une reformulation, pas simplement une coupure.

– Le Keyword stuffing est en action. Nous le savons, pourtant nous en constatons tous les jours. Les mots-clés sont regroupés dans un unique bloc. Ils ne sont pas ventilés sur tout le texte.

=> Il faut répartir les mots-clés sur l’ensemble du texte. Ces derniers ne sont pas les seuls concernés. C’est aussi valable pour n’importe quelle expression.

– Répétition abusive des autres termes signifiants du texte. Un même mot signifiant utilisé dans 3 phrases qui se suivent alourdit la lecture. 

Il est extrêmement facile pour une machine de repérer cette anomalie. 

=> Personnellement, je demande souvent à mon ordinateur de me lire le texte à haute voix. Je ferme les yeux et j’écoute. Avec l’aide de l’audio, ce type de défaut vous fait bondir ! Vous pouvez également vous assister d’un logiciel comme Druide-Antidote.

– Le texte ne correspond pas avec son titre. Nous voyons parfois un titre « putaclic » et quand nous lisons, ça fait plouf… Parfois aussi, le sujet nous plaît, nous lisons, mais nous nous demandons quand il va enfin être abordé et traité !

=> Le contenu doit expliciter le titre éditorial. Vous devez rester dessus et ne pas digresser. Votre visiteur vient vous honorer de sa lecture, tenez la promesse faite par votre titre.

Potentiellement repérable via les dictionnaires dont dispose Google, certains mots précis sont rattachés à chaque sujet. S'ils sont absents, c'est curieux. Même si le système n'est pas encore parfait, c'est ce que nous essayons de faire avec les metamots.

– Les intertitres ne correspondent pas avec les paragraphes qu’ils englobent.

=> Les paragraphes développent les intertitres; ils sont liés. Nous avons là exactement le même souci que précédemment. 

Votre intertitre est censé coller à une problématique. Assurez-vous qu’effectivement vous y répondiez.

Mais pas seulement car vous pouvez être tenté d'aborder d’autres points dedans. Demandez-vous s’il ne vaut pas mieux faire un second texte détaillant ces nouvelles idées. Vous ferez, ensuite, un lien vers celui-ci. 

– Les balises vont par paires sauf la H1 et sont imbriquées.

=> Vous ne mettez pas une seule H2 ou une seule H3, etc. Les H3 doivent être incluses dans une H2, les H4 dans une H3… Quoi de plus facile à vérifier pour un algorithme ?

– Le « chapô » est très long. Il ne correspond pas à la pyramide inversée chère à Isabelle Canivet.
=> Le « chapô » doit faire un et un seul paragraphe et annoncer la couleur. Soit la personne a envie de lire ensuite, soit pas. Mais ne la trompez pas… Google a plusieurs façons de savoir si, dès le départ, vous tentez de mystifier votre lecteur. L’une d’entre elles est le retour à la SERP. Mais il y a d’autres méthodes comme la présence de certaines ponctuations, etc.

– La « title » et la H1 sont exactement les mêmes.

=> Elles doivent toutes les deux commencer par l’expression à valoriser, mais être différentes. Elles doivent aussi être uniques. La « title », de plus, doit être limitée en nombre de caractères. 

Identiques, ça sent l’automatisme à plein nez et, au mieux, la fainéantise. La « title » s’adresse surtout à ceux qui lisent un résultat de recherche. La H1 vise celui qui est déjà sur votre site ou votre page. Ici, je ne parle pas forcément de la triplette du bourrin de Laurent Bourrelly. Je fais référence au signal d’indifférence que vous envoyez au moteur !

– La « méta decsription » est trop généraliste.

=> La « méta decsription » doit inciter à la lecture du texte. Elle est destinée à conforter l’internaute qui est sur Google. Elle est différente du « chapô ». N’utilisez jamais de méta decsriptionautomatique. Rédigez-là soigneusement, comme s’il s’agissait d’un texte d’annonce adwords. Reprenez dedans le mot-clé pressenti, car Google va tenter de les mettre en gras.

NOTE : quelque part, la « title » et la « méta decsription» font partie du marketing. La h1 et le contenu concernent plutôt la rédaction. Il y a une subtilité à comprendre ici.

– Le texte est déjà présent en partie ou en totalité sur le net.

=> Vous devez faire un texte unique. Savoir qu’on a rédigé soi-même son contenu ne suffit pas. Nous sommes souvent influencés par ce que nous avons lu ou entendu. Par ailleurs, le hasard fait aussi partie de la vie. Google ne s’intéresse que peu à ce qu’il a vu par avant. Je pense que nous le savons tous, mais nous l'oublions souvent.

– Le langage n’est pas adapté : jargon, argot, etc.

=> vous devez choisir le bon langage (registre courant, voire soutenu, et non familier). Je ne me prive pas moi-même d’un zeste d’humour dans mes chroniques. Mais il faut faire attention à certaines expressions, utilisables uniquement à l’oral. Google lit tout. Il peut parfaitement buter sur un terme qu’il juge « ennemi » de votre lectorat. Cela fera baisser la note qualité. Pour ma part, j'ai remarqué une baisse d'intérêt pour certains contenus quand le ton sonnait « trop forum ».

– Le texte est bourré de fautes ou de mots trop rares.

=> Faites un texte sans faute, en français correct avec la bonne ponctuation. En pratique, Google n’est pas un être humain. Les fautes et mots rares peuvent jouer contre vous. 

Vous pouvez user de mots rares. Toutefois, ils doivent être utilisés dans votre thématique, et passim. Vous prenez un risque sinon.

La ponctuation a aussi son importance. L’analyse s’opère par fragments séparés par certains signes. Sur certaines thématiques, hors des smyleys, nous avons trouvé beaucoup de « ; ». Un manque de « ; » pourra, alors, dégrader l’appréciation que le moteur aura de votre prose. C’est assez curieux.

– Les langues sont mélangées.

=> Vous ferez une page par langue en utilisant la balise hreflang. En pratique, cela a toujours été un souci pour Google. Du coup, un morceau en anglais dans un texte français peut passer pour du charabia. Par contre, utilisé en citation courte, cela peut tout de même être toléré.

– Le texte est rempli de nous, je, on.
=> Ne parlez pas de vous, mais mettez-vous à la place de vos lecteurs.
Trop de mélange et il est facile pour une machine de décider que l'auteur n'est pas très bon…
Dans certains cas, vous montrerez que vous êtes « avec » votre internaute. Vous pourrez, par conséquent, utiliser le « nous ». Vous pouvez le faire dans un tutoriel par exemple. Vous vous en servirez, alors, dans tout le tutoriel. 
Le « on » est à bannir autant que possible. Le machine-learning de Google n’a pas forcément appris que c’était un sujet. Est-il usité dans votre thématique et pour le profil du lectorat ciblé ? Pourquoi l’employez-vous ? Dans le doute, pour ma part, je tente de l'éviter.
– Faire du Google-texte.
=> Le contenu doit, avant tout, être rédigé pour l’internaute. Pour autant, il sera structuré pour être repéré comme tel par Google. 
Notre propos, ici, comment faire pour que Google distingue la qualité de vos contenus. Nonobstant cela, il s’agit plutôt d’une forme de SEO. Vous ne devez pas dégrader la perception que Google a de votre texte. Cela serait dommage surtout que ce dernier a été écrit avec beaucoup d’amour.
– Le texte est sans intérêt.
=> Celui-ci doit apporter quelque chose au lecteur, une valeur ajoutée. En faisant cela, l’internaute va rester plus longtemps sur votre page. Il le recommandera peut-être à d’autres. Google a les moyens de détecter l'intérêt pour un texte grâce aux signaux sociaux, par exemple.
Je vous donne une astuce, mais vous n’êtes pas obligé de me croire. Mettez plutôt le bouton de partage en fin de texte. Il sera probablement plus valorisé que les autres. Je pense notamment à ceux placés à peine l’internaute arrivé sur la page. Si ce n'est peut-être pas encore en place actuellement (je n'arrive pas à le savoir). Mais à l'évidence, sur le plan humain, le partage en fin d'article a plus de valeur.
– Le scope change (niveau de détail).
=> Cela peut troubler l’internaute. Exemple, vous commencez un texte. Vous donnez beaucoup d’explications et de précisions. Subitement, vous vous rendez compte que le texte devient trop long. Vous ne traitez, dès lors, les choses qu’en surface. C’est aisément détectable. Cela sent le texte de x mots commandé à un rédacteur. En effet, celui-ci ne dépassera pas, généralement, le nombre de caractères acheté. Là encore, c’est un signal visible.
– Plusieurs idées cohabitent dans un même paragraphe.
=> Un paragraphe développe une idée, le plus souvent. Vous ciblerez ainsi un internaute particulier via un paragraphe. Vous ne pouvez pas courir plusieurs lièvres à la fois. Est-ce détectable ? Dans certains cas, oui, via une anomalie dans certaines associations de mots. Google le fait-il ? Pas de réponse définitive pour le moment sauf si tout le texte est rédigé ainsi. 
– Vous n’avez que du texte, mais vos concurrents ont des images.
=> Il faut ajouter, de préférence, des médias (photos, vidéos). Là aussi, ne perdez pas en pertinence. Faites l’effort d’illustrer vos pages. (Sur cocon.se, dans la section metamots, le « parfum » vous donne des pistes.)
– Des choses fausses sont présentes dans le contenu.
=> Vous ne devez dire que des choses vraies, si possible vérifiables. Tous les domaines ne s’y prêtent pas. Un gros travail est fait en ce moment sur tout ce qui est fake-news. Mais, dans bien des domaines aussi, personne ne peut affirmer où se situe la vérité. Tous les domaines ne sont pas forcément décidables.
Note personnelle : Où est la vérité ? J'en ai moi-même été victime récemment en parlant d'un site à succès sur lequel aucun Netlinking n'avait jamais été fait. Mais parce qu'il avait du succès, il a reçu naturellement quelques liens. Les SEO qui sont trop habitués aux liens artificiels ont imaginé que c'était les liens qui avaient généré le trafic… Sauf que les liens sont arrivés grâce du succès du site, après coup. De toute façon, il n'y avait pas assez de liens pour expliquer le trafic obtenu, mais passons. C'est pourquoi j'ai affirmé que le nos avis étaient influencées par le prisme de nos habitudes…. 
Si vous vendez un produit qui est rattaché à des réglementations, datez vos dires. Mettez au besoin des liens vers les sources officielles. Méfiez-vous des fausses interprétations que les internautes pourraient en avoir. 
D’une certaine façon, nous sommes dans une forme de traçabilité. Le fait de citer une norme ISO, par exemple, est un petit plus non négligeable. Cela sera apprécié par le moteur, particulièrement si c’est accompagné des microdonnées idoines.
– Les verbes doivent être ceux en usage dans votre thématique.
=> Exemple : « prescrire une agence de communication ». Le souci est que « prescrire » ne fait pas habituellement partie du vocabulaire de cette thématique. C’est un verbe spécialisé. Google peut parfaitement le noter comme anomalie.
– Certaines associations malheureuses de mots pouvaient vous faire filtrer par Google. 
=> Nous avons vu par le passé un site entier classé comme pornographique. Il avait utilisé une simple boutade, incomprise de Google, dans un seul billet, de mémoire. Il y a encore de soucis de ce côté.
Aparté
Il existe des algorithmes bien pratiques. Ils permettent d’avoir des informations dans son ensemble sur la lisibilité d’un texte. Ils vous renseignent également sur le niveau requis du lecteur.

– Flesh
– Flesh-Kincaid
– Gunning fog
– Colieman-Liau
J’avoue ne pas savoir si Google les utilise pour juger une page. Pareillement, j’ignore s’il s’en sert pour évaluer l’internaute visé. Mais si ce n’est pas déjà fait, cela viendra peut-être. Cela sera fait soit avec un algo à lui ou avec un de ceux-là. 


Il dispose aussi de ses propres vecteurs qui permettent de faire des choses très amusantes. Je pense qu’il arrive à savoir quand un lien est plutôt négatif que positif. C’est mon avis, même si Google semble dire le contraire…

Autres points, mais que Google ne révèle pas forcément aujourd'hui et ne fera peut-être jamais

– L’usage de termes pompeux (expert, leader, etc.) est à proscrire.

=> Prenez garde à ces termes, ils sont réglementés. Par exemple, leader suppose que vous ayez, en France, au minimum 20 % du marché. Vous devez être à même de le prouver.

Ces lexèmes sont donc dangereux à manipuler. Certains peuvent notamment vous engager juridiquement parlant. Là, ce n’est plus forcément du SEO. Mais, en réalité, il n’y a qu’à vous qu’ils font plaisir.

– Une information était vraie à un moment, mais est devenue caduque.

=> Datez les éléments susceptibles de varier dans le temps. De préférence, mettez à jour le texte si l’information est périmée.

Conclusion

Google a crié haut et fort qu'il fallait faire des contenus de qualité. Sur le moment, la communauté SEO s'est demandé ce qu'il appelait un contenu de qualité. Comment Google serait-il bien capable de la déterminer ?

Aujourd'hui, nous nous apercevons au minimum qu'il est capable de détecter ce qui n'est PAS un contenu de qualité. C'est en particulier par la forme qu'il y parvient. Le Machine-Learning est passé par là.

Un texte peut être écrit avec sincérité et talent. Ce qu’en ressent l’internaute est impalpable pour un moteur. Mais, il a plusieurs moyens de taille pour évaluer votre travail : 

    • le sujet, les metamots montrent qu’il les « comprend » de mieux en mieux,

    • la quantité d’anomalies ci-dessus trouvées dans votre texte, 

    • la réaction des internautes (commentaires, partages).

En soi, nous pourrions résumer les choses ainsi. L’appréciation de la qualité d’un texte est une sorte de permis à points. Il part de la note maximum. Au fil de l’analyse, il n’a de cesse d’en retirer des points.

Le trafic est très dépendant de la qualité perçue par le moteur. 

Libre à vous de travailler comme il y a 15 ans. Vous pouvez aussi évoluer au rythme que Google nous impose. Quoi qu'il en soit, des textes bien écrits et intéressants attirent naturellement les partages, les liens et surtout les internautes !

C'est entre vos mains : à vous de jouer  !