L'ELI, un levier pour la veille juridique

L’identifiant européen de législation (ELI), en permettant le tissage de liens entre les textes de loi, ouvre des perspectives prometteuses pour la veille juridique. Toutefois du chemin reste à parcourir.

Les professions juridiques vont devoir s’habituer à un nouvel acronyme, l’ELI, pour European Legislation Identifier. Il s’agit d’une norme d’identification des textes juridiques, définie en 2012 par la Commission européenne, et proposée aux Etats-membres sur la base du volontariat. La France fait partie des 4 paysà avoir adopté ce principe. Une quinzaine d’autres pays, y compris extérieurs à l’Union européenne, envisagent de l’adopter à leur tour.

Conçu à l’ère du web sémantique, l’ELI permet d'identifier tout texte de loi, décret, ordonnance, arrêté, et chacun de ses articles, par un URI[1], structuré par la date de publication. Les textes communautaires sont préfixés avec data.europa.eu, les français avec legifrance.gouv.fr.

Un format que les professions juridiques doivent s’approprier

L’ELI n’est pas seulement un simple numéro. Il s’accompagne de métadonnées, pour le moment encapsulées à même le texte HTML, en format RDFa. La Direction de l'information légale et administrative, (DILA)[3] prévoit de les mettre à disposition dans un triple store, au format RDF[4], standard le plus "ouvert et aisément réutilisable, c'est-à-dire lisible par une machine", pour reprendre les termes de ce même article 2 de la loi Valter.

Le format RDF se prête en effet au croisement des bases de données du web sémantique. Ces données sont extraites par le langage de requête SPARQL, dont la syntaxe est dérivée du SQL, utilisé en entreprise pour attaquer les bases de données relationnelles. A titre d’exemple, l’INSEE publie déjà au format RDF les données de référence sur les territoires et les activités économiques (codes NAF). L’outil d’annotation des procédures administratives soumises à la règle "silence vaut accord", prototypé dans le cadre du programme Open Law Europa, qui vient de s’achever, permet ainsi de désigner, par leur code NAF, les secteurs économiques concernés par un texte donné.

Autre exemple, la DILA et l’Institut Géographique National (IGN) viennent de lancer le projet JOLoc, consistant à annoter les textes avec des données de géolocalisation. Il sera possible de trouver les textes applicables à un secteur géographique spécifique, par exemple celui sur le travail le dimanche dans les zones touristiques internationales.

Une norme à étendre

Si la conception de l’ELI et de ses métadonnées associées est aboutie, leur implémentation sur les textes et la mise au format de ceux-ci en RDF sont loin d’être achevées.

L’ELI est pour le moment mis en œuvre, en France, sur le seul Journal Officiel, et sur les textes datés depuis 2002 seulement. La DILA a prévu d’introduire prochainement l’ELI sur la loi consolidée. C’est important parce que les services de veille juridique dans les entreprises travaillent essentiellement sur des textes consolidés.

La veille juridique commence avant le vote de la loi. C’est pourquoi l’Assemblée nationale et le Sénat, déjà engagés dans une politique de données ouvertes, devraient adopter l’ELI et participer au chainage des textes publiés par la DILA avec les projets, propositions de loi et autres rapports qui en sont à l’origine. Les entreprises pourraient ainsi mieux suivre l’évolution des projets législatifs les concernant.

La loi vit. Les métadonnées doivent être complétées ou mises à jour en fonction des événements ultérieurs à la publication initiale de la loi. Par exemple, l’entrée en vigueur d’une loi peut être subordonnée à un autre acte juridique. C’est donc la naissance de cet acte qui doit entrainer l’ajout de cette métadonnée sur la loi. Notons à cet égard que le "workflow" législatif est plus complexe au niveau national qu’au niveau communautaire.

Dans certains secteurs économiques, la veille juridique porte davantage sur les corpus réglementaires que sur le corpus législatif proprement dit. Par exemple, le règlement général de l’Autorité des Marchés Financiers est une source légale essentielle pour les établissements financiers, de même que le règlement intérieur de l’ARCEP pour le secteur des télécoms. 42 Autorités Administratives Indépendantes (AAI) produisent ainsi en France des contenus réglementaires, qui gagneraient à être normés selon l’ELI. L’article 9 du projet de loi Lemaire stipule que "la mise à disposition et la publication des données de référence en vue de faciliter leur réutilisation constituent une mission de service public relevant de l’État. Toutes les autorités administratives concourent à cette mission". Gageons que le décret d’application assimilera les textes réglementaires à des "données de référence".

De même, au niveau communautaire, les autorités européennes de surveillance (ESMA pour les marchés, EBA pour la banque, EIOPA pour l’assurance) pourraient utilement publier leurs textes en format ELI, même si les normes techniques, leur principale production, ne relèvent pas à proprement parler de la législation (le "L" d’ELI).

Il ne faut pas davantage se fermer à la "soft law". Nombre d’autorités produisent des avis ou recommandations auxquelles les entreprises se soumettent souvent, en dépit de leur caractère non contraignant. Un document de "Q&A" (questions/réponses) produit par une autorité comme l’ESMA peut aussi aider une banque à se mettre en conformité sur une réforme spécifique de façon opérationnelle.

Enfin, la jurisprudence. S’il existe une norme séparée, l’ECLI, pour European Case Law Identifier, celle-ci est conçue pour l’enregistrement des décisions des tribunaux, et ne permet pas, à ce stade, d’identifier par son ELI tout texte invoqué par un jugement. De plus, il n’est pas sûr que l’ECLI convienne aux AAI pour identifier leurs délibérations, en particulier pour lier les sanctions qu’elles prononcent aux articles concernés de leur règlement.

L’outillage en annotation sémantique, un complément nécessaire

Parce que toutes les juridictions n’adopteront pas l’ELI et que celles qui l’adoptent avanceront chacune à leur rythme, tous les liens objectifs entre textes ne seront pas explicites. A défaut de disposer d’identifiants et de métadonnées ELI, les utilisateurs devront avoir les moyens techniques de tisser les liens manquants. Ces utilisateurs seront les éditeurs juridiques, les entreprises et les communautés d’experts, qui auront chacun leur rôle à jouer.

Le premier niveau de tissage requis est automatisable. L’outillage relève de la fouille de texte ("text-mining") et de l’annotation sémantique. Il s’agit de « moissonner » les textes publiés par les émetteurs du droit, d’y reconnaître les mots-clefs juridiques ("loi", "article", "considérant", "exposé des motifs", etc…), et d’y détecter les citations de texte (par exemple, "chapitre II du titre Ier de la loi n° 78-753 du 17 juillet 1978"), quelle qu’en soit la forme syntaxique.

Un document légal ne porte pas nécessairement sur une seule thématique. Des textes fourre-tout, des cavaliers législatifs ou des règlements très techniques nécessitent une annotation sémantique de deuxième niveau qui, elle, sera manuelle, d’autant que l’annotation est d’autant plus subjective qu’on l’exerce à une maille fine.

Des pratiques à harmoniser dans l’écriture du droit

La qualité et l’exhaustivité du tissage automatique des liens entre textes ne dépend pas du seul outillage informatique. Le respect de conventions bibliographiques et des règles stylistiques, lors de la rédaction des textes, n’est pas moins important. L’Office des Publications de l’Union Européenne et les organes nationaux de publication légale se sont constitués chacun un guide de bonnes pratiques, mais il n’en va pas de même pour les AAI, en France, et leurs homologues chez les autres Etats-Membres. Le problème est encore plus patent sur la « soft law ». Les autorités administratives qui n’adopteraient pas l’ELI pourraient, à défaut, harmoniser leurs règles de structuration et de rédaction de leurs textes pour faciliter le travail de veille réglementaire en entreprise.

[1] Unified Resource Identifier

[2] Public Sector Information

[3] Direction de l’Information Légale et Administrative

[4] Le Resource Description Framework est un standard dérivé du XML mis au point par le World Wide Web Consortium. Un triple store est une base de données conçue pour le stockage au format RDF