PRATIQUE XML 
Expliquez-moi... GRDDL : une syntaxe pour relier XHTML, XML et RDF
 
Comment faire entrer les données disponibles aux formats XHTML et XML dans le monde de RDF et du Web Sémantique ? La réponse du W3C : un mécanisme explicite liant l'espace de nom à son algorithme de traitement. (27/11/2006)
  Forum

Réagissez dans les forums de JDN Développeurs

Spécification W3C récemment passée au stade de document de travail, GRDDL (pour Gleaning Resource Descriptions from Dialects of Languages, récupération des descriptions de ressource depuis des dialectes de langages) introduit une syntaxe servant à déclarer qu'un document XML contient des données récupérables en RDF, et à pointer vers un algorithme permettant cette récupération.

Depuis longtemps, les langages SGML et XML avaient la possibilité de décrire les contraintes syntactiques de leur vocabulaire, à l'aide d'une DTD ou d'un langage de schéma. Il leur manquait cependant le mécanisme pour établir la relation entre ces contraintes syntaxiques et leurs implications sémantiques. GRDDL vise donc à exploiter la sémantique offerte par XML et XHTML à l'aide du format RDF, dans le cadre plus large du Web Sémantique (lire "Le Web Sémantique").

RDF (pour Resource Description Framework, le modèle de métadonnée du W3C) est pour le W3C au coeur du moteur du Web Sémantique, et le format à adopter quand il s'agit de partager sur le Web des informations à traiter. Cependant, le format reste négligé par les producteurs de contenus, en faveur de XML et XHTML. L'idée est donc de combler l'écart entre ces deux mondes, XML/XHTML et RDF, par le biais du mécanisme GRDDL.

Le fichier XML souhaitant afficher les données traitables qu'il contient devra, pour être utilisé par GRDDL, ajouter à son élément racine une déclaration de l'espace de nom grddl, ainsi qu'un attribut spécifique grddl:transformation. Les deux attributs doivent pointer respectivement vers les URL des espaces de noms utilisés, et un script capable de transformer ces données au format RDF - le plus souvent, on fera appel à XSLT :
  1. <html xmlns="http://www.w3.org/1999/xhtml"
  2.   xmlns:data-view="http://www.w3.org/2003/g/data-view#"
  3.   data-view:transformation="http://www.w3.org/2003/12/rdf-in-xhtml-xslts/grokFOAF.xsl
  4.    http://www.w3.org/2003/12/rdf-in-xhtml-xslts/grokCC.xsl
  5.    http://www.w3.org/2003/12/rdf-in-xhtml-xslts/grokGeoURL.xsl">
  6. <head>
  7. ...
Cette syntaxe évoluera certainement avec le document, mais l'objectif visé par ce nouveau document du W3C reste le même : créer un pont entre données et sens, entre XML et RDF, afin d'élargir les possibilités du Web Sémantique. Au moyen de GRDDL, un fichier XML n'aura qu'à implémenter un espace de nom, un attribut et un fichier XSLT pour donner un accès à ses données via RDF.

GRDDL facilite donc la pratique autrement hasardeuse du traitement de fichiers XML/XHTML : avec ce mécanisme, l'auteur du document indique explicitement que ses données peuvent être extraites, et pointe même vers l'algorithme à utiliser. GRDDL peut par exemple fonctionner avec les Microformats (lire "Les microformats, une méthode de qualification des données"), et profiter des données marquées à l'aide de ces différentes syntaxes.
 
Xavier Borderie, JDN Développeurs
 
 
Accueil | Haut de page