Les opérateurs de recherche Google : la recherche avancée pour une meilleure analyse SEO

Depuis de nombreuses années maintenant, Google propose de nombreuses options permettant de filtrer les résultats de son index selon des options bien précises. Ces options ou opérateurs de recherche vont permettre d’adapter le périmètre d’une recherche.

Définition : Les opérateurs de recherche Google, c’est quoi en réalité?

Par défaut, la recherche sur les moteurs se fait par l’intermédiaire de mots-clés. Jusque-là, pas de problèmes.

Fig. 1 : Recherche standard

En parallèle, Google autorise l’intégration d’opérateurs pour une recherche dite avancée [1] permettant un filtrage "manuel" des résultats pour plus de précision.

Dans cette perspective, il est par exemple possible de contraindre le moteur de recherche à baser ses résultats sur un seul site (site:ndd.extension mot-clé de la recherche) ou encore de remonter toutes les URLs contenant telle ou telle expression ou encore des variables.


Fig. 2 : Exemple de recherche avancée avec opérateurs intitle: et inurl: en contraignant le moteur à proposer des résultats contenant le mot-clé "ordinateurs" dans l’URL et dans le title de la page


Dans le premier exemple, pour fournir un résultat pertinent à l’internaute en partant d’une requête large comme "ordinateurs", Google propose des résultats transactionnels et informationnels.Dans le second, le moteur est soumis au même exercice mais reste contraint par la présence du mot-clé "ordinateurs" dans l’URL (inurl:) et le title (intitle:) de la page. Avec cette contrainte, on passe de plus de 43 millions de résultats dans le premier exemple à seulement 240 000 avec les opérateurs. On obtient en outre des pages de résultats complètement différentes, la première remonte d’abord les résultats transactionnels quand la seconde renvoie, elle, des résultats informationnels.Vous pouvez, si vous ne maîtrisez pas encore les opérateurs avant la lecture de cet article, passer par l’outil « Recherche avancée » de Google mais ce dernier est beaucoup moins souple qu’une recherche avec les opérateurs dans les SERPs.

Les opérateurs de recherche avancée

Il existe de nombreux opérateurs de recherche ; certains sont utiles quotidiennement (site:, info:) d’autres ne sont plus viables et tombent progressivement dans l’oubli (link: ,inanchor:).


L’opérateur de recherche site:

Cet opérateur permet d’avoir le nombre total de pages connues et donc indexées par Google à un instant t. Il est utilisé en tant qu’alternative au rapport "Etat de l’indexation" fournit au sein de la Search Console. Si vous ne l’utilisez pas quotidiennement, il y a un problème.

Exemple d’utilisationFig. 3 : Résultat de la recherche site:journaldunet.com

Cette formule permet de connaître la totalité des pages indexées pour un domaine précis. Bien entendu, ce volume bouge sans cesse et reste un indicateur approximatif.


Fig. 4 : Résultat de la recherche site:journaldunet.com/apple

Il est ensuite possible d’avoir le nombre de pages indexées d’un répertoire, d’un sous-domaine etc. Ici, on constate que Google a enregistré 93 pages dans le répertoire /apple.



Fig. 5 : Résultat de la recherche site:journaldunet.com/apple

En consultant la liste des résultats sur le répertoire /apple, on remarque de nombreuses pages de pagination. Pour connaître la répartition du nombre de pages de pagination indexées sur l’ensemble du répertoire, il suffit de reprendre toutes les pages incluant la variable « page= ». On voit alors que la quasi-totalité des pages indexées sur ce répertoire sont des pages de pagination relayant des articles disponibles sur d’autres catégories du site, un tag en somme.Astuce 

Cet opérateur est très pratique mais peut s’avérer trompeur s’il est mal utilisé. Il faut veiller à utiliser le nom de domaine afin d’englober la totalité des pages. Par exemple, la recherche site:journaldunet.com remonte 1,6 millions de résultats à l’heure ou cet article est rédigé quand la recherche site:www.journaldunet.com n’en remonte, elle, que 746 000. En effet, la recherche avec www ne prend pas en compte tous les sous-domaines affiliés au nom de domaine qui représentent au final la moitié des pages indexées par Google pour le domaine journaldunet.com.

Pour éviter les callosités et l’érosion de vos touches C et V, voici un petit bout de code à placer dans vos favoris pour générer un site: pour la page sur laquelle vous vous trouvez le tout en un seul clic .

javascript:(function(){window.open('http://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3A'+encodeURIComponent(location.href))})();


L’opérateur de recherche info:

Ce dernier est similaire à l’opérateur site:. Il se différencie par son périmètre d’action. La recherche info: doit être suivie d’une URL et non d’un site (en ajoutant le nom de domaine derrière cet opérateur de recherche, vous aurez un résultat concernant la page d’accueil du site). Cet opérateur permet de voir si une page est indexée par Google. Le résultat est binaire ; si le moteur de recherche remonte un résultat, c’est que la page est indexée, à l’inverse, elle ne l’est pas.
Exemple d’utilisation : 
Fig. 6 : Résultat de la recherche info:journaldunet.com 

Astuce 

Si vous mettez le nom de domaine, Google vérifiera si la page d’accueil est indexée. Cette fonction est très utile mais n’est pas encore automatisée. L’opérateur site: ne fournissant qu’un échantillon du nombre de pages effectivement indexées, si vous souhaitez vérifier si toutes les pages de votre site sont indexées, vous devez nécessairement passer par cet opérateur.

Tout comme le site:, le info: est utilisé très fréquemment. Vous pouvez donc exploiter le même bout de code que celui fournit pour le site: simplement en modifiant site: par info:.


L’opérateur de recherche filetype:

filetype: est un opérateur de recherche qui peut s’avérer très utile. En ajoutant cet opérateur à votre recherche, vous pourrez demander à Google de ne remonter qu’un seul type de fichiers dans les résultats. Par exemple, si vous souhaitez ne récupérer que des exemples de tableur sur de la comptabilité ou de la stratégie, une recherche « plan de financement PME filetype:xls » vous permettra de récupérer des fichiers téléchargeables sur lesquels vous baser.

Cet opérateur ne fonctionne pas avec toutes les extensions de fichiers mais les plus utilisées sont compatibles :   

  • Adobe Flash (.swf)
  • Adobe Portable Document Format (.pdf) soit filetype:pdf
  • Adobe PostScript (.ps) soit filetype:ps
  • Autodesk Design Web Format (.dwf) soit filetype:dwf
  • Google Earth (.kml, .kmz) soit filetype:kml etc.
  • GPS eXchange Format (.gpx) soit filetype:gpx
  • Hancom Hanword (.hwp) soit filetype:hwm
  • HTML (.htm, .html, et autres extensions) soit filetype:htm etc.
  • Microsoft Excel (.xls, .xlsx) soit filetype:xls etc.
  • Microsoft PowerPoint (.ppt, .pptx) soit filetype:ppt etc.
  • Microsoft Word (.doc, .docx) soit filetype:doc etc.
  • OpenOffice presentation (.odp) soit filetype:odp
  • OpenOffice spreadsheet (.ods) soit filetype:ods
  • OpenOffice text (.odt) soit filetype:odt
  • Rich Text Format (.rtf) soit filetype:rtf
  • Scalable Vector Graphics (.svg) soit filetype:svg
  • TeX/LaTeX (.tex) soit filetype:tex
  • Text (.txt, .text, et autres extensions) soit filetype:txt etc.
  • Basic source code (.bas) soit filetype:bas
  • C/C++ source code (.c, .cc, .cpp, .cxx, .h, .hpp) soit filetype:c etc.
  • C# source code (.cs) soit filetype:cs
  • Java source code (.java) soit filetype:java
  • Perl source code (.pl) soit filetype:pl
  • Python source code (.py) soit filetype:py
  • Wireless Markup Language (.wml, .wap) soit filetype:wml etc.
  • XML (.xml) soit filetype:xml

Astuce   

Pensez- vous mettre à la place du créateur du fichier pour faire votre requête. Les personnes à l’origine de ces documents ne l’ont pas fait dans une optique d’indexation et de gain de trafic. Les fichiers n’ont par conséquent pas de champs optimisés.

Personnellement, j’aime beaucoup commencer mes formations avec quelques failles du moteur pour montrer à quel point le il est important de maîtriser le SEO pour se développer mais également pour se protéger. Pour le faire, j’utilise la recherche suivante :

filetype:xls intext:password OR intext:"mot de passe" -intext:reset

Vous aurez alors une liste de résultats dont certains regroupent des accès à divers outils en ligne. Attention, il est formellement interdit d’exploiter ces résultats même s’ils sont disponibles sur Google. C’est à titre informatif et uniquement dans le but de montrer la puissance des opérateurs de recherche que cette recherche est présente dans cet article. 


L’opérateur de recherche intitle:

L’opérateur intitle: permet de regrouper tous les résultats  mentionnant le mot-clé précisé dans le titre de la page (title en anglais). Peu utile lorsqu’il est utilisé seul, il peut s’avérer intéressant à plusieursL’opérateur intitle: permet de regrouper tous les résultats mentionnant le mot-clé précisé dans le titre de la page (title en anglais). Peu utile lorsqu’il est utilisé seul, il peut s’avérer intéressant à plusieurs égards comme nous le verrons plus tard avec les liaisons d’opérateurs.Exemple d’utilisation zidane intitle:coup de bouleAstuceintitle: prend en compte la casse, les accents et le nombre (singulier/pluriel). Par ailleurs, le correcteur d’orthographe n’est pas activé contrairement aux recherches traditionnelles.


L’opérateur de recherche inurl:

L’opérateur de recherche inurl: est similaire au précédent mais s’attache à vérifier la présence d’un mot-clé ou d’une chaîne de caractères dans l’URL de tous les résultats potentiels.Exemple d’utilisation :  inurl:MAT=*p= AstuceSi par exemple votre site utilise la variable « MAT= » dans les URLs pour faire un filtrage par matière de tous vos produits et que vous souhaitez savoir combien de pages en plus de la landing principale sont indexées par Google, vous pouvez effectuer une recherche avancée avec opérateurs. Ici, « MAT= » reprend la première expression recherchée, l’étoile « * » est similaire à la formule « .* » des expressions régulières et va vérifier si la page testée intègre la seconde condition sans tenir compte de la chaîne de caractère qui se situe entre les deux. Dans cet exemple, il s’agit de la variable « p= » souvent utilisée pour la pagination. En définitive, cet opérateur de recherche va faire remonter toutes les pages de pagination indexées lorsque le filtre MAT est sélectionné.

L’opérateur de recherche related

Cet opérateur de recherche Google va faire remonter les résultats liés, d’après les algorithmes de Google, à une URL.Exemple d’utilisation :  related:lemonte.fr

L’opérateur de recherche cache:

En précédant une URL dans la recherche de l’opérateur cache: vous obtiendrez la version de la page mise en cache par Google, c’est-à-dire, la version de la page web lorsque Google l’a crawlée pour la dernière fois.

Exemple d’utilisation : cache:cdiscount.com
Astuce
La première recherche vous donne la page telle qu’elle a été vue par Google lors de son dernier passage ainsi que l’heure et la date de ce dernier passage. Si vous reprenez les deux pages de notre exemple vous noterez sans doute une différence de plusieurs jours entre la page d’accueil et la page sous-catégorie. La page d’accueil des sites web étant le point d’entrée dans la plupart des cas, Google se doit de toujours avoir la version la plus fraîche possible. Plus un site est important, plus l’heure et la date du cache sont proches de l’heure à laquelle l’on fait la recherche.
Vous pouvez également obtenir le même résultat en cliquant sur le petit triangle vert à droite de l’URL dans les pages de résultats du moteur. Vous aurez la plupart du temps le choix entre « En cache » et « Pages similaires ». L’option « Pages similaires » ajoute simplement un related: à votre requête.


L’opérateur de recherche intext:

Rarement utile, il peut s’avérer nécessaire dans certains cas. Cet opérateur de recherche vous permet de vérifier la présence d’un mot-clé ou d’une expression dans le corps d’une page. Cette recherche exclue donc les chaînes de caractères présentes dans le title ou encore l’URL.
Exemple d’utilisation :  intext:nike pas cher Astuce
Cet opérateur peut vous permettre d’avoir une idée des pages ou des sites qui font de l’optimisation agressive en reprenant des ancres non naturelles et une fréquence très haute de certaines expressions.


L’opérateur de recherche link:  

L’opérateur de recherche link: ressort un échantillon de pages web intégrant un lien en direction de la ressource spécifiée après l’opérateur. Attention, il ne s’agit là que d’un échantillon de pages. Le résultat n’est donc pas viable pour une analyse globale du linking d’une page.
Exemple d’utilisation :  link:https://support.google.com/websearch/answer/2466433?hl=fr Astuce
Cet opérateur n’est pas viable pour une analyse globale mais peut ponctuellement être utile pour voir qui a utilisé une page comme source ou encore pour savoir si une page commence à générer des liens ou encore s’il existe des pages dupliquées. Cet opérateur reste relativement peu utile.


L’opérateur de recherche inanchor: (dans l’ancre)

Avec inanchor:, vous pouvez cibler les pages qui utilisent une chaîne de caractères précise comme texte pour positionner un lien hypertexte en direction d’une autre ressource web.
Exemple d’utilisation : inanchor:"iphone 7" intitle:"pas cher" -site:cdiscount.com

Astuce
Cet opérateur permet de connaître les sites concurrents sur une requête précise (l’utilisation des ancres optimisées étant révélateur d’une activité SEO sur le site).
Les opérateurs de recherche avancée les plus utiles sont listées là. Vous pouvez aller encore plus loin en intégrant les opérateurs booléens dans vos recherches. Il est ainsi possible de restreindre encore davantage les résultats d’une recherche que cette dernière soit basé sur une ressource du web ou sur un mot-clé.


Les opérateurs de recherche basiques

L’opérateur de recherche étoile (*)

Cet opérateur n’est pas un opérateur booléen à proprement parler. A l’instar des expressions régulières, l’étoile permet d’élargir une condition à plusieurs variables.Exemple d’utilisation  inurl:MAT=*p= AstuceCe point a déjà été détaillé dans le paragraphe concernant l’opérateur de recherche inurl:


L’opérateur de recherche "votre recherche ici"

Les guillemets permettent d’empêcher l’intégration par défaut de l’opérateur booléen ET entre les mots d’une recherche reprenant plusieurs mots-clés. Le moteur de recherche de Google va alors se concentrer sur les pages web connues intégrant précisément l’expression placée entre parenthèse.Exemple d’utilisation  intitle:"iphone 7 pas cher" AstuceComme les autres opérateurs booléens, ce dernier peut être couplé à l’ensemble des opérateurs de recherche, booléens ou non. Ici, on recherche les pages pertinentes reprenant précisément dans le titre de la page l’expression « iphone 7 pas cher » (un site optimisé pour la vente d’iPhone 7 donc).


L’opérateur de recherche «..»

En plaçant deux points entre deux valeurs numériques, il est possible de demander à Google des résultats compris dans une échelle de valeur. Cela peut être une gamme de prix ou encore une distance.

Exemple d’utilisation"iphone 7" 400..500 € Astuce

L’unité doit être intégrée avec un espace après la seconde valeur numérique. Le résultat est souvent décevant. En intégrant des exclusions et d’autres opérateurs, vous pourrez cependant obtenir des résultats à la hauteur et parfois meilleurs que les comparateurs.


L’opérateur de recherche « - » 

Le trait d’union permet de retirer volontairement une chaîne de caractères (mot ou expression) d’une recherche.

Exemple d’utilisation zidane italie -"coup de tête"

Astuce

Cet opérateur est très utile et sert à de très nombreuses occasions. Il peut être couplé avec l’ensemble des autres opérateurs de recherche et permet par exemple de connaître la répartition des URLs en HTTPS ou sans HTTPS indexées par Google après une migration.


L’opérateur de recherche ()

Les parenthèses, comme avec l’algèbre mathématique, permet de créer des sous-ensembles et de créer des règles de priorisation dans la recherche des résultats.

Exemple d’utilisation

(iphone 6 OU iphone 7) (400..500 €) -"à partir de" -inurl:amazon.fr -intitle:remise

Astuce

On couple ici un ensemble d’opérateurs de recherche afin d’obtenir via les pages de résultats de Google la liste la plus exhaustive en terme de recherche de prix. Les parenthèses regroupent les différentes parties de la requête. Au global, on souhaite un iPhone 6 ou 7 entre 400 et 500 euros ailleurs que sur le site Amazon en France. Les résultats ne devront pas avoir de mention « à partir de » dans le texte et rédigés sans le mot « remise » dans le title. On obtient alors des résultats beaucoup plus précis qu’une simple recherche « iphone pas cher ».


Les opérateurs booléens dans la recherche Google

Les opérateurs booléens sont, en informatique, des directives logiques permettant de croiser des résultats de l’index de Google sur des requêtes précises. Par défaut, ces derniers sont les opérateurs ET et OU. Ils peuvent être mutualisés pour aller de plus en plus loin dans une recherche.






L’opérateur booléen ET

Ce dernier n’est pas utile dans le cadre des recherches au sein du moteur de recherche car il est appliqué par défaut à partir du moment où votre recherche dépasse un seul mot-clé. Par exemple, si vous effectuez une recherche telle que ‘voiture bleue’, Google va intégrer l’opérateur booléen ET entre ‘voiture’ et ‘bleue’.

Exemple d’utilisation voiture ET bleue Astuce

En faisant le test, on s’aperçoit que la page de résultat est exactement la même lorsqu’on effectue la recherche avec ou sans l’opérateur


L’opérateur booléen OU

Cet opérateur a également un usage limité. Il permet de coupler les résultats entre deux termes lors d’une recherche sur une même thématique par exemple lorsque les appellations possibles sont multiples.

Exemple d’utilisation Annales 1ère S OU Annales première S

Ici, on demande à Google de remonter les résultats concernant les annales de première S peu importe la version utilisée dans les résultats des pages ; chiffrée ou littérale.

Astuce

Cet opérateur est rarement utilisé seul mais peut s’avérer très utile. Par exemple, si on sait que l’on veut un smartphone d’une marque spécifique mais que l’on ignore la marque ou le modèle, l’opérateur peut vous permettre de regrouper tous les résultats sur une seule et même recherche. Il est l’équivalent du caractère | (Alt Gr + 6)


Les autres opérateurs

Il existe de nombreux autres opérateurs de recherche. Ces derniers restent relativement peu utiles dans le cadre d’une analyse SEO.

·         #requete - permet de faire une recherche de hastag

·         @requete - permet de faire une recherche focalisée sur les réseaux sociaux

·         requete AROUND(X) requete - permet de remonter les pages avec un nombre maximum de mots entre les deux parties de la requête

·         define:requete – permet d’avoir une définition souvent tirée de Wikipédia

·         map:ville – permet d’avoir directement la carte d’une région

·         stocks:entreprise – permet d’avoir le cours en bourse d’une société cotée

·         weather:ville – permet d’avoir une vue globale sur la météo d’une ville/région

·         etc.


Comment utiliser les opérateurs de recherche pour une bonne analyse SEO


Connaître la progression d’une migration

Si vous avez effectué une migration pour passer sur la version sécurisée du protocole HTTP, vous pouvez vérifier l’évolution de la transition.

site:monsite.extension pour avoir le nombre de pages indexées sur un domaine

site:monsite.extension inurl:https pour avoir le nombre de pages indexées en HTTPS

site:monsite.extension -inurl:https pour vérifier que le nombre correspond au total de l’étape 1


Connaître la répartition de l’indexation par catégorie

Si vous souhaitez savoir comment Google indexe votre site dans le détail, vous pouvez faire des recherche par répertoire, par langue, par variable etc.

site:monsite.extension pour avoir le nombre de pages indexées sur un domaine

site:monsite.extension/repertoire-n pour avoir le nombre de pages indexées sur les n répertoires


Connaître le nombre de pages paginées indexées pour un site

site:monsite.extension pour avoir le nombre de pages indexées sur un domaine

Identifier la variable relative à la pagination sur le site (exemple « p= » ou encore « page= »)

site:monsite.extension inurl:page=2..100 pour avoir le nombre de pages de pagination indexées pour un site (le = et le & ne sont pas pris en compte, l’ajout d’une échelle numérique permet de contourner le problème)

Par exemple, pour le site Aushopping.com du groupe Auchan, en utilisant les opérateurs de recherche, on peut voir que le site n’a pas de problème de pagination. Sur plus de 2 millions de pages indexées, le site n’a plus que 536 pages de paginations dont la moitié sont des pages 2 et 3. Par ailleurs, on note qu’aucune d’entre elles ne remonte sur les pages positionnées des outils d’analyse (Yooda et SEMrush pour le test).

Les opérateurs de recherche permettent d’avoir une vue globale sur une étape encore peu analysée par les outils : l’indexation. Ces derniers ont cependant une limite ; ils ne peuvent intégrer des contraintes relatives au code source. Par exemple, si vous souhaitez savoir pour une quelconque raison la répartition des pages indexées par ordre de prix, le seul moyen d’aller plus loin est de scraper toutes les pages pour récupérer le prix des produits puis de vérifier si chacune d’entre elles est indexée.

Seul Google connaît dans le détail les URLs indexées d’un site. S’il propose un nombre approximatif au sein de la Search Console et avec l’opérateur site: (qui ne sont jamais équivalent), il ne permet toujours pas de les récupérer. Si vous souhaitez donc savoir comment récupérer la totalité des URLs indexées pour un site donné, il vous faudra automatiser les requêtes site: et info: … mais Google n’aime pas trop シ!

[1]  On différencie ici la recherche avec opérateurs et la fonctionnalité Recherche avancée proposée par le moteur

Moteur de recherche / Référencement naturel