Google Analytics : les principales expressions régulières à connaître

Google Analytics : les principales expressions régulières à connaître Pour définir des objectifs ou des segments personnalisés, certaines expressions régulières ou "RegEx" peuvent être particulièrement utiles pour Google Analytics. En voici les principales.

Les "RegEx", ou les "expressions régulières", ne sont pas forcément faciles à appréhender, mais elles peuvent rendre bien des services dans Google Analytics. Les RegEx sont des caractères un peu spéciaux qui permettent en effet, dans l'outil de Google, de définir des objectifs, des filtres ou des segments personnalisés, ou encore d'exclure des adresses IP du trafic pris en compte.

Voici une liste, introductive et non-exhaustive, de celles qui sont le plus souvent utilisées.

 
RegEx pour Google Analytics
Caractère Effet Exemple d'utilisation
Source : JdN
. Sera remplacé par n'importe quel caractère (mais un seul caractère) goo.le va donc faire remonter google, goolle, gooxle, goo0le, goo8le, etc
* Supprime le caractère précédent, ou le rajoute, une ou plusieurs fois. REF0*12 va donc faire remonter REF012, REF0012, REF00012, REF00000012 et REF12
? Supprime ou laisse le caractère précédent colou?r va faire remonter à colour et color
+ Ajoute le caractère précédent une ou plusieurs fois ab+c fera remonter un a suivi par un ou plusieurs b, suivi par un c
| Equivaut à "ou" google|bing|yahoo correspond à google, bing ou yahoo
^ Marque strictement le début de la chaine. ^site correspond à site, mais pas à monsite. Idem pour les IP : ^74 va faire remonter les IP 74.xxx.xxx.xxx mais pas 174.xxx.xxx.x
$ Marque strictement la fin de la chaine .htm$ ne va donc pas faire remonter .html, mais faire remonter .htm).
() Permet de créer des groupes différents éléments. Souvent associé au caractère| Sep(tembre)? va faire remonter Sep ou Septembre. Apple (iOS|iPhone) Device va faire remonter Apple iOS Device et Apple iPhone Device.
[] Sera remplacé par chaque caractère à l'intérieur des []. /page/[234] va faire remonter page 2, page 3 et page 4
- Correspond à "à", et sépare donc le début de la fin d'une liste /page/[2-9] va faire remonter toutes les pages dont les fins d'url vont de /page/2 à /page/9.
, Correspond à "entre" {2,4} veut dire entre 2 et 4 fois.
{} Indique le nombre de fois que le précédent caractère doit être répété. Contient aussi souvent des traits d'unions ou des virgules ab{2,4}c va rechercher un a suivi de 2, 3 ou 4 b, suivi par un c

A noter que la combinaison des caractères . et *  ouvre un grand champ. Par exemple : .*/page/3/.* va faire remonter toutes les page/3 du site. Bien évidemment, les RegEx se corsent quand il s'agit d'en utiliser plusieurs d'un coup. C'est pourtant ainsi qu'elles sont souvent utilisées. Exemple : /^[0-9]{1,3}$/ fait remonter 1, 2, ou 3 chiffres compris entre 0-9. Cela recherchera donc les chiffres de 0 à 999.

Les RegEx pour exclure des IP du trafic analysé

L'un des premiers contacts avec les RegEx peut être au moment d'implémenter Google Analytics à un site. En effet, il faudra bien évidemment exclure les IP de l'entreprise ayant créé le site. C'est d'ailleurs l'une des questions posées par Google pour obtenir le GAIQ, la qualification Google Analytics.

Ainsi, pour exclure par exemple les IP allant de 193.88.222.1 à 193.88.22.10, l'expression régulière correspondante est ^193\.88\.222\.([1-9] |10)$

Les RegEx pour créer des filtres ou des segments avancés personnalisés

Les RegEx peuvent aussi être très utiles pour créer des segments avancés personnalisés. Par exemple, pour le SEO, les expressions régulières vont permettre de mesurer le trafic généré par des requêtes de trois mots clés et les comparer avec le trafic généré par des requêtes de deux mots (voir comment dans notre article "Améliorer sa "longue traîne" avec Google Analytics)

Les RegEx peuvent aussi être très utiles pour mettre en place des filtres. Par exemple, des experts ont réussi à trouver le filtre qui permet de faire apparaître, dans Google Analytics, la position des mots clés, dans les résultats de Google, et le trafic généré par ces mots clés. Ou de quelles pages de résultats proviennent les visites issues des moteurs de recherche.

Tester les RegEx

Compte tenu de leur complexité, surtout pour les débutants, il ne faut pas hésiter à les tester, ce que permet par exemple Google Analytics lors de la création d'une variable personnalisée. Plusieurs outils en ligne existent aussi, et certains sont même officiellement conseillés par Google.

Lire aussi
- Comment combiner les statistiques de plusieurs sites dans Google Analytics ?