"Techniques de référencement web" : les bonnes feuilles La technique du headless browser

Google propose une solution appelée headless browser pour éviter que l'Ajax soit un problème majeur pour l'indexation et le positionnement des pages (source). En effet, une URL classique ressemble à http://www.monsite.com/mapage.html alors qu'en Ajax, elle diffère et prend plutôt la forme suivante : http://www.monsite.com/#mapage. Dans ce cas, Google ne peut pas accéder au contenu ni indexer la page.

Google a trouvé une parade qui consiste à ajouter un point d'exclamation dans les URL pour que l'URL soit indexable. L'URL de notre exemple devient alors http://www.monsite.com/#!mapage et cela indique au moteur qu'il va pouvoir la lire comme un utilisateur lambda.

Dans les faits, l'adresse web est modifiée et prend un paramètre intitulé _escaped_fragment_ en lieu et place du #! de l'Ajax. De ce fait, l'URL est prise en compte par le moteur pour lire la page de façon classique et elle ressemble à la suivante :

http://www.monsite.com/_escaped_fragment_=mapage

la technique du headless browser expliquée et schématisée par google
La technique du headless browser expliquée et schématisée par Google © Eyrolles
En réalité, tout n'est pas si simple car la technique du headless browser demande une configuration complexe du serveur, ce qui est tout bonnement impossible sur la majorité des hébergements web (notamment les mutualisés). De plus, cela ne corrige pas le problème pour les autres moteurs de recherche car seul Google a proposé cette alternative. Nous n'entrerons donc pas dans les détails inutiles de l'installation de HtmlUnit ou de Jetty pour faire fonctionner cette technique.