Les opérateurs de recherche Google : la recherche avancée pour une meilleure analyse SEO
Depuis de nombreuses années maintenant, Google propose des options permettant de filtrer les résultats de son index selon des options bien précises. Ces options ou opérateurs de recherche vont permettre d’adapter le périmètre d’une recherche.
Définition : Les opérateurs de recherche Google, c’est quoi en réalité?
Par défaut, la recherche sur les moteurs se fait par l’intermédiaire de mots-clés. Jusque-là, pas de problèmes.
En parallèle, Google autorise l’intégration d’opérateurs pour une recherche dite avancée [1] permettant un filtrage "manuel" des résultats pour plus de précision.
Dans cette perspective, il est par exemple possible de contraindre le moteur de recherche à baser ses résultats sur un seul site (site:ndd.extension mot-clé de la recherche) ou encore de remonter toutes les URLs contenant telle ou telle expression ou encore des variables.
Fig. 2 : Exemple de recherche avancée avec opérateurs intitle: et inurl: en contraignant le moteur à proposer des résultats contenant le mot-clé "ordinateurs" dans l’URL et dans le title de la page
Il existe de nombreux opérateurs de recherche ; certains sont utiles quotidiennement (site:, info:) d’autres ne sont plus viables et tombent progressivement dans l’oubli (link: ,inanchor:).
L’opérateur de recherche site:
Cet opérateur permet d’avoir le nombre total de pages connues et donc indexées par Google à un instant t. Il est utilisé en tant qu’alternative au rapport "Etat de l’indexation" fournit au sein de la Search Console. Si vous ne l’utilisez pas quotidiennement, il y a un problème.
Cette formule permet de connaître la totalité des pages indexées pour un domaine précis. Bien entendu, ce volume bouge sans cesse et reste un indicateur approximatif.
Fig. 4 : Résultat de la recherche site:journaldunet.com/apple
Il est ensuite possible d’avoir le nombre de pages indexées d’un répertoire, d’un sous-domaine etc. Ici, on constate que Google a enregistré 93 pages dans le répertoire /apple.
Fig. 5 : Résultat de la recherche site:journaldunet.com/apple
En consultant la liste des résultats sur le répertoire /apple, on remarque de nombreuses pages de pagination. Pour connaître la répartition du nombre de pages de pagination indexées sur l’ensemble du répertoire, il suffit de reprendre toutes les pages incluant la variable « page= ». On voit alors que la quasi-totalité des pages indexées sur ce répertoire sont des pages de pagination relayant des articles disponibles sur d’autres catégories du site, un tag en somme.
Astuce
Cet opérateur est très pratique mais peut s’avérer trompeur
s’il est mal utilisé. Il faut veiller à utiliser le nom de domaine afin
d’englober la totalité des pages. Par exemple, la recherche
site:journaldunet.com remonte 1,6 millions de résultats à l’heure ou cet article
est rédigé quand la recherche site:www.journaldunet.com n’en remonte, elle, que
746 000. En effet, la recherche avec www ne prend pas en compte tous les
sous-domaines affiliés au nom de domaine qui représentent au final la moitié
des pages indexées par Google pour le domaine journaldunet.com.
Pour éviter les callosités et l’érosion de vos touches C et V, voici un petit bout de code à placer dans vos favoris pour générer un site: pour la page sur laquelle vous vous trouvez le tout en un seul clic .
javascript:(function(){window.open('http://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3A'+encodeURIComponent(location.href))})();L’opérateur de recherche info:
Ce dernier est similaire à l’opérateur site:. Il se différencie par son périmètre d’action. La recherche info: doit être suivie d’une URL et non d’un site (en ajoutant le nom de domaine derrière cet opérateur de recherche, vous aurez un résultat concernant la page d’accueil du site). Cet opérateur permet de voir si une page est indexée par Google. Le résultat est binaire ; si le moteur de recherche remonte un résultat, c’est que la page est indexée, à l’inverse, elle ne l’est pas.Exemple d’utilisation
Astuce
Si vous mettez le nom de domaine, Google vérifiera si la
page d’accueil est indexée. Cette fonction est très utile mais n’est pas encore
automatisée. L’opérateur site: ne fournissant qu’un échantillon du nombre de
pages effectivement indexées, si vous souhaitez vérifier si toutes les pages de
votre site sont indexées, vous devez nécessairement passer par cet opérateur.
Tout comme le site:, le info: est utilisé très fréquemment. Vous pouvez donc exploiter le même bout de code que celui fournit pour le site: simplement en modifiant site: par info:.
L’opérateur de recherche filetype:
filetype: est un opérateur de recherche qui peut s’avérer très utile. En ajoutant cet opérateur à votre recherche, vous pourrez demander à Google de ne remonter qu’un seul type de fichiers dans les résultats. Par exemple, si vous souhaitez ne récupérer que des exemples de tableur sur de la comptabilité ou de la stratégie, une recherche « plan de financement PME filetype:xls » vous permettra de récupérer des fichiers téléchargeables sur lesquels vous baser.
Cet opérateur ne fonctionne pas avec toutes les extensions de fichiers mais les plus utilisées sont compatibles :
- Adobe Flash (.swf)
- Adobe Portable Document Format (.pdf) soit filetype:pdf
- Adobe PostScript (.ps) soit filetype:ps
- Autodesk Design Web Format (.dwf) soit filetype:dwf
- Google Earth (.kml, .kmz) soit filetype:kml etc.
- GPS eXchange Format (.gpx) soit filetype:gpx
- Hancom Hanword (.hwp) soit filetype:hwm
- HTML (.htm, .html, et autres extensions) soit filetype:htm etc.
- Microsoft Excel (.xls, .xlsx) soit filetype:xls etc.
- Microsoft PowerPoint (.ppt, .pptx) soit filetype:ppt etc.
- Microsoft Word (.doc, .docx) soit filetype:doc etc.
- OpenOffice presentation (.odp) soit filetype:odp
- OpenOffice spreadsheet (.ods) soit filetype:ods
- OpenOffice text (.odt) soit filetype:odt
- Rich Text Format (.rtf) soit filetype:rtf
- Scalable Vector Graphics (.svg) soit filetype:svg
- TeX/LaTeX (.tex) soit filetype:tex
- Text (.txt, .text, et autres extensions) soit filetype:txt etc.
- Basic source code (.bas) soit filetype:bas
- C/C++ source code (.c, .cc, .cpp, .cxx, .h, .hpp) soit filetype:c etc.
- C# source code (.cs) soit filetype:cs
- Java source code (.java) soit filetype:java
- Perl source code (.pl) soit filetype:pl
- Python source code (.py) soit filetype:py
- Wireless Markup Language (.wml, .wap) soit filetype:wml etc.
- XML (.xml) soit filetype:xml
Pensez-vous mettre à la place du créateur du fichier pour faire votre requête. Les personnes à l’origine de ces documents ne l’ont pas fait dans une optique d’indexation et de gain de trafic. Les fichiers n’ont par conséquent pas de champs optimisés.Personnellement, j’aime beaucoup commencer mes formations avec quelques failles du moteur pour montrer à quel point le il est important de maîtriser le SEO pour se développer mais également pour se protéger. Pour le faire, j’utilise la recherche suivante :
filetype:xls intext:password OR intext:"mot de passe" -intext:reset
Vous aurez alors une liste de résultats dont certains regroupent des accès à divers outils en ligne. Attention, il est formellement interdit d’exploiter ces résultats même s’ils sont disponibles sur Google. C’est à titre informatif et uniquement dans le but de montrer la puissance des opérateurs de recherche que cette recherche est présente dans cet article.
L’opérateur de recherche intitle:
L’opérateur intitle: permet de regrouper tous les résultats mentionnant le mot-clé précisé dans le titre de la page (title en anglais). Peu utile lorsqu’il est utilisé seul, il peut s’avérer intéressant à plusieursL’opérateur intitle: permet de regrouper tous les résultats mentionnant le mot-clé précisé dans le titre de la page (title en anglais). Peu utile lorsqu’il est utilisé seul, il peut s’avérer intéressant à plusieurs égards comme nous le verrons plus tard avec les liaisons d’opérateurs.Exemple d’utilisation : zidane intitle:coup de bouleAstuce
intitle: prend en compte la casse, les accents et le nombre (singulier/pluriel). Par ailleurs, le correcteur d’orthographe n’est pas activé contrairement aux recherches traditionnelles.
L’opérateur de recherche inurl:
L’opérateur de recherche inurl: est similaire au précédent mais s’attache à vérifier la présence d’un mot-clé ou d’une chaîne de caractères dans l’URL de tous les résultats potentiels.Exemple d’utilisation : inurl:MAT=*p=
Astuce
Si par exemple votre site utilise la variable « MAT= » dans les URLs pour faire un filtrage par matière de tous vos produits et que vous souhaitez savoir combien de pages en plus de la landing principale sont indexées par Google, vous pouvez effectuer une recherche avancée avec opérateurs. Ici, « MAT= » reprend la première expression recherchée, l’étoile « * » est similaire à la formule « .* » des expressions régulières et va vérifier si la page testée intègre la seconde condition sans tenir compte de la chaîne de caractère qui se situe entre les deux. Dans cet exemple, il s’agit de la variable « p= » souvent utilisée pour la pagination. En définitive, cet opérateur de recherche va faire remonter toutes les pages de pagination indexées lorsque le filtre MAT est sélectionné.
L’opérateur de recherche related:
Exemple d’utilisation : related:lemonte.fr
La première recherche vous donne la page telle qu’elle a été vue par Google lors de son dernier passage ainsi que l’heure et la date de ce dernier passage. Si vous reprenez les deux pages de notre exemple vous noterez sans doute une différence de plusieurs jours entre la page d’accueil et la page sous-catégorie. La page d’accueil des sites web étant le point d’entrée dans la plupart des cas, Google se doit de toujours avoir la version la plus fraîche possible.
Plus un site est important, plus l’heure et la date du cache sont proches de l’heure à laquelle l’on fait la recherche.
Vous pouvez également obtenir le même résultat en cliquant sur le petit triangle vert à droite de l’URL dans les pages de résultats du moteur. Vous aurez la plupart du temps le choix entre « En cache » et « Pages similaires ». L’option « Pages similaires » ajoute simplement un related: à votre requête.
L’opérateur de recherche intext:
Rarement utile, il peut s’avérer nécessaire dans certains cas. Cet opérateur de recherche vous permet de vérifier la présence d’un mot-clé ou d’une expression dans le corps d’une page. Cette recherche exclue donc les chaînes de caractères présentes dans le title ou encore l’URL.Exemple d’utilisation : intext:nike pas cher
Astuce
Cet opérateur peut vous permettre d’avoir une idée des pages ou des sites qui font de l’optimisation agressive en reprenant des ancres non naturelles et une fréquence très haute de certaines expressions.
L’opérateur de recherche link:
L’opérateur de recherche link: ressort un échantillon de pages web intégrant un lien en direction de la ressource spécifiée après l’opérateur. Attention, il ne s’agit là que d’un échantillon de pages. Le résultat n’est donc pas viable pour une analyse globale du linking d’une page.Astuce
Cet opérateur n’est pas viable pour une analyse globale mais peut ponctuellement être utile pour voir qui a utilisé une page comme source ou encore pour savoir si une page commence à générer des liens ou encore s’il existe des pages dupliquées. Cet opérateur reste relativement peu utile.
L’opérateur de recherche inanchor: (dans l’ancre)
Avec inanchor:, vous pouvez cibler les pages qui utilisent une chaîne de caractères précise comme texte pour positionner un lien hypertexte en direction d’une autre ressource web.Exemple d’utilisation : inanchor:"iphone 7" intitle:"pas cher" -site:cdiscount.com
Astuce
Cet opérateur permet de connaître les sites concurrents sur une requête précise (l’utilisation des ancres optimisées étant révélateur d’une activité SEO sur le site).
Les opérateurs de recherche avancée les plus utiles sont listées là. Vous pouvez aller encore plus loin en intégrant les opérateurs booléens dans vos recherches. Il est ainsi possible de restreindre encore davantage les résultats d’une recherche que cette dernière soit basé sur une ressource du web ou sur un mot-clé.
Les opérateurs de recherche basiques
L’opérateur de recherche étoile (*)
Cet opérateur n’est pas un opérateur booléen à proprement parler. A l’instar des expressions régulières, l’étoile permet d’élargir une condition à plusieurs variables.Exemple d’utilisation : inurl:MAT=*p= AstuceCe point a déjà été détaillé dans le paragraphe concernant l’opérateur de recherche inurl:
L’opérateur de recherche "votre recherche ici"
Les guillemets permettent d’empêcher l’intégration par défaut de l’opérateur booléen ET entre les mots d’une recherche reprenant plusieurs mots-clés. Le moteur de recherche de Google va alors se concentrer sur les pages web connues intégrant précisément l’expression placée entre parenthèse.Exemple d’utilisation : intitle:"iphone 7 pas cher"
Astuce
Comme les autres opérateurs booléens, ce dernier peut être couplé à l’ensemble des opérateurs de recherche, booléens ou non. Ici, on recherche les pages pertinentes reprenant précisément dans le titre de la page l’expression « iphone 7 pas cher » (un site optimisé pour la vente d’iPhone 7 donc).
L’opérateur de recherche «..»
En plaçant deux points entre deux valeurs numériques, il est possible de demander à Google des résultats compris dans une échelle de valeur. Cela peut être une gamme de prix ou encore une distance.Exemple d’utilisation : "iphone 7" 400..500 € AstuceL’unité doit être intégrée avec un espace après la seconde valeur numérique. Le résultat est souvent décevant. En intégrant des exclusions et d’autres opérateurs, vous pourrez cependant obtenir des résultats à la hauteur et parfois meilleurs que les comparateurs.
L’opérateur de recherche « - »
Le trait d’union permet de retirer volontairement une chaîne de caractères (mot ou expression) d’une recherche.Exemple d’utilisation : zidane italie -"coup de tête"Astuce
Cet opérateur est très utile et sert à de très nombreuses occasions. Il peut être couplé avec l’ensemble des autres opérateurs de recherche et permet par exemple de connaître la répartition des URLs en HTTPS ou sans HTTPS indexées par Google après une migration.
L’opérateur de recherche ()
Les parenthèses, comme avec l’algèbre mathématique, permet de créer des sous-ensembles et de créer des règles de priorisation dans la recherche des résultats.Exemple d’utilisation : (iphone 6 OU iphone 7) (400..500 €) -"à partir de" -inurl:amazon.fr -intitle:remiseAstuce
On couple ici un ensemble d’opérateurs de recherche afin d’obtenir via les pages de résultats de Google la liste la plus exhaustive en terme de recherche de prix. Les parenthèses regroupent les différentes parties de la requête. Au global, on souhaite un iPhone 6 ou 7 entre 400 et 500 euros ailleurs que sur le site Amazon en France. Les résultats ne devront pas avoir de mention « à partir de » dans le texte et rédigés sans le mot « remise » dans le title. On obtient alors des résultats beaucoup plus précis qu’une simple recherche « iphone pas cher ».
Les opérateurs booléens dans la recherche Google
Les opérateurs booléens sont, en informatique, des directives logiques permettant de croiser des résultats de l’index de Google sur des requêtes précises. Par défaut, ces derniers sont les opérateurs ET et OU. Ils peuvent être mutualisés pour aller de plus en plus loin dans une recherche.L’opérateur booléen ET
Ce dernier n’est pas utile dans le cadre des recherches au sein du moteur de recherche car il est appliqué par défaut à partir du moment où votre recherche dépasse un seul mot-clé. Par exemple, si vous effectuez une recherche telle que ‘voiture bleue’, Google va intégrer l’opérateur booléen ET entre ‘voiture’ et ‘bleue’.Exemple d’utilisation : voiture ET bleue AstuceEn faisant le test, on s’aperçoit que la page de résultat est exactement la même lorsqu’on effectue la recherche avec ou sans l’opérateur.L’opérateur booléen OU
Cet opérateur a également un usage limité. Il permet de coupler les résultats entre deux termes lors d’une recherche sur une même thématique par exemple lorsque les appellations possibles sont multiples.Exemple d’utilisation : Annales 1ère S OU Annales première S
Ici, on demande à Google de remonter les résultats concernant les annales de première S peu importe la version utilisée dans les résultats des pages ; chiffrée ou littérale.
Astuce
Cet opérateur est rarement utilisé seul mais peut s’avérer très utile. Par exemple, si on sait que l’on veut un smartphone d’une marque spécifique mais que l’on ignore la marque ou le modèle, l’opérateur peut vous permettre de regrouper tous les résultats sur une seule et même recherche. Il est l’équivalent du caractère | (Alt Gr + 6)
Les autres opérateurs
Il existe de nombreux autres opérateurs de recherche. Ces derniers restent relativement peu utiles dans le cadre d’une analyse SEO.#requete - permet de faire une recherche de hashtag
@requete - permet de faire une recherche focalisée sur les réseaux sociaux
requete AROUND(X) requete - permet de remonter les pages avec un nombre maximum de mots entre les deux parties de la requête
define:requete – permet d’avoir une définition souvent tirée de Wikipédia
map:ville – permet d’avoir directement la carte d’une région
stocks:entreprise – permet d’avoir le cours en bourse d’une société cotée
weather:ville – permet d’avoir une vue globale sur la météo d’une ville/région
etc.
Comment utiliser les opérateurs de recherche pour une bonne analyse SEO
Connaître la progression d’une migration
Si vous avez effectué une migration pour passer sur la version sécurisée du protocole HTTP, vous pouvez vérifier l’évolution de la transition.
site:monsite.extension pour avoir le nombre de pages indexées sur un domaine
site:monsite.extension inurl:https pour avoir le nombre de pages indexées en HTTPS
site:monsite.extension -inurl:https pour vérifier que le nombre correspond au total de l’étape
Connaître la répartition de l’indexation par catégorie
Si vous souhaitez savoir comment Google indexe votre site dans le détail, vous pouvez faire des recherche par répertoire, par langue, par variable etc.
site:monsite.extension pour avoir le nombre de pages indexées sur un domaine
site:monsite.extension/repertoire-n pour avoir le nombre de pages indexées sur les n répertoires
Connaître le nombre de pages paginées indexées pour un site
site:monsite.extension pour avoir le nombre de pages indexées sur un domaine
Identifier la variable relative à la pagination sur le site (exemple « p= » ou encore « page= »)
site:monsite.extension inurl:page=2..100 pour avoir le nombre de pages de pagination indexées pour un site (le = et le & ne sont pas pris en compte, l’ajout d’une échelle numérique permet de contourner le problème)
Par exemple, pour le site Aushopping.com du groupe Auchan, en utilisant les opérateurs de recherche, on peut voir que le site n’a pas de problème de pagination. Sur plus de 2 millions de pages indexées, le site n’a plus que 536 pages de paginations dont la moitié sont des pages 2 et 3. Par ailleurs, on note qu’aucune d’entre elles ne remonte sur les pages positionnées des outils d’analyse (Yooda et SEMrush pour le test).
Les opérateurs de recherche permettent d’avoir une vue globale sur une étape encore peu analysée par les outils : l’indexation. Ces derniers ont cependant une limite ; ils ne peuvent intégrer des contraintes relatives au code source. Par exemple, si vous souhaitez savoir pour une quelconque raison la répartition des pages indexées par ordre de prix, le seul moyen d’aller plus loin est de scraper toutes les pages pour récupérer le prix des produits puis de vérifier si chacune d’entre elles est indexée.
Seul Google connaît dans le détail les URLs indexées d’un site. S’il propose un nombre approximatif au sein de la Search Console et avec l’opérateur site: (qui ne sont jamais équivalent), il ne permet toujours pas de les récupérer. Si vous souhaitez donc savoir comment récupérer la totalité des URLs indexées pour un site donné, il vous faudra automatiser les requêtes site: et info: … mais Google n’aime pas trop シ!
[1] On différencie ici la recherche avec opérateurs et la fonctionnalité Recherche avancée proposée par le moteur