L'Ajax, bientôt pris en compte par l'index de Google

Intégré à 70% des sites Web, l'Ajax n'était jusque-là pas pris en considération par le moteur de recherche. Google vient d'annoncer qu'il comblerait très bientôt ce manque.

Incompris par les moteurs de recherche, l'Ajax (pour Asynchronous JavaScript and XML) pourrait enfin être déchiffré par Google. Cette technologie qui mélange Javascript et XML est utilisé pour des sites dynamiques et pour les applications Internet. Très pratique, il a malheureusement un sérieux inconvénient, il ne se retrouve pas dans l'index des moteurs de recherche Web.  

Aujourd'hui, les sites Internet qui utilisent l'Ajax génèrent des pages HTML en doublon des autres pour favoriser l'indexation. Pire encore, ce langage est souvent mis en œuvre pour les endroits des sites qui ne nécessitent pas forcément un référencement.  

Une modification de la syntaxe des URLs

Quasi incontournable pour un site, le Javascript est utilisé, selon Google, pour 70% des sites Web. Partant de ce constat, l'objectif de la firme de Mountain View est de donner la possibilité à ses robots de naviguer et d'indexer les contenus Web reposant sur ce langage.

L'ajout du signe ! dans l'URL de la page Web

Pour y parvenir, Google entend classiquement faire en sorte que le contenu Ajax pris en compte dans le référencement soit équivalent à celui consulté par les internautes. Autre idée : limiter le travail des propriétaires de site souhaitant voir leurs pages Ajax être prises en compte, et leur fournir un moyen simple de maitriser le processus d'indexation.

Une commande permettant au site de renvoyer un contenu traduit au format HTML


Pour faciliter le travail d'indexation du moteur sur les contenus en Ajax, Google conseille de modifier la syntaxe de certaines URLs. En plus du caractère "#", il convient ainsi de rajouter le signe "!" pour les pages Web qui contiennent du code Ajax. Les ancres "#" sont en fait utilisées pour l'exécution de paramètres dans les fonctions Javascript.

C'est justement ce caractère que les robots Google ont du mal à percevoir. En ajoutant "!", cela permettrait au moteur de le remplacer par une commande "_escaped_fragment_".  Un tag qui permettrait aux serveurs de Web de savoir qu'il est visité par un robot de Google, et qu'il doit donc renvoyer au moteur un contenu HTML (format que Google est capable de décoder à la différence du Javascript).  

Attention toutefois, les parties de sites qui sont cachées aujourd'hui, seraient dorénavant visibles, et pourraient poser des problèmes. Ce pourrait être le cas par exemple des paniers sur les sites marchands.  

Il faut se souvenir qu'un site technologiquement avancé, en utilisant Flash et Ajax, rencontre de gros problèmes de référencement. En effet, une structure de balisage simple respectant les standards classiques de publication Web, permet de figurer plus facilement en tête des résultats sur les moteurs de recherche.