Pour une interopérabilité sémantique des applications IoT sur les espaces européens des données

L'ontologie SAREF (Smart Applications REFerence Ontology) est à l'honneur de l'ETSI IoT Conférence 2023. Elle est développée à l'ETSI pour contribuer à la stratégie européenne en matière de données.

Lors de l'ETSI IoT Conférence, qui se tient du 4 jusqu’au 6 juillet dans les locaux de l'Institut européen des normes de télécommunications (ETSI) à Sophia-Antipolis, plusieurs présentations porteront sur l'ontologie SAREF, qui est une contribution de l'ETSI à l'interopérabilité sémantique sur les espaces européens des données. 

La stratégie européenne en matière de données, et les espaces européens des données

Les espaces européens des données ont pour vocation de mettre en commun les données européennes dans différents secteurs économiques et domaines d'intérêt public, dont l'énergie, l'industrie manufacturière, la santé, la mobilité, ou encore les services publics. Leur développement est soutenu par la commission européenne, afin de faciliter l'exploitation de la valeur des données au profit de l’économie et de la société européenne. Cela fait partie de la stratégie européenne en matière de données (EU Data Strategy), qui doit permettre à l’Union européenne de devenir un acteur de premier plan dans une société axée sur les données. 

Le socle législatif de cette stratégie est formé de deux piliers: la loi sur la gouvernance des données (European Data Governance Act), et le règlement européen sur les données (European Data Act). La première vise à renforcer la confiance dans le partage des données, à renforcer les mécanismes visant à accroître la disponibilité des données et à surmonter les obstacles techniques à la réutilisation des données. La seconde précise qui peut créer de la valeur à partir des données et dans quelles conditions. En particulier, elle vise à faciliter l'utilisation des données générées par les appareils de l'internet des objets (IoT) par les utilisateurs de ces objets, par exemple pour bénéficier de services innovants offerts par d'autres entreprises que le fabricant de l'objet.

Si l'importance de ces textes a déjà été présentée dans des articles du Journal Du Net, par exemple ici et , l'aspect crucial de la standardisation et de l'interopérabilité des données n'a pas encore été exposé.

Source: https://ec.europa.eu/newsroom/dae/redirection/document/83517 

L'interopérabilité des données et les ontologies

La standardisation et l'interopérabilité sémantique sont présentés dans le Data Act comme jouant un rôle essentiel dans l'apport de solutions techniques permettant de garantir l'interopérabilité. Le texte précise : "Considérant que : (79) Les spécifications communes devraient être élaborées de manière ouverte et transparente, en consultation avec l’industrie et les parties prenantes concernées. Il conviendrait que fassent également partie des spécifications techniques de l’interopérabilité sémantique des structures et modèles de données réutilisables (sous la forme de vocabulaires de base), des ontologies, un profil d’application des métadonnées, des données de référence sous la forme d’un vocabulaire de base, des taxonomies, des listes de codes, des tables d’autorité et des thésaurus."

Le chapitre VIII de cette proposition de loi porte spécifiquement sur l'interopérabilité, notamment les exigences essentielles concernant l’interopérabilité des espaces de données (article 28), l'interopérabilité et la portabilité des services de traitement des données (article 29), et les exigences essentielles concernant les contrats intelligents pour le partage de données (article 30).

Sur l'aspect technique, on peut résumer ainsi : 

Les données, les métadonnées qui doivent les accompagner, et les moyens techniques pour accéder à ces données (par exemple les API), doivent satisfaire aux principes FAIR :  elles doivent être Faciles à trouver, Accessibles, Interopérables, et Réutilisables. 

Dès que c'est possible, il s'agit de réutiliser le standard, le consensuel, l'existant, pour structurer et pour modéliser les données, afin de faciliter l'interopérabilité et la portabilité des données et des services de traitement de ces données.

L'initiative du Web des données portée par le World Wide Web Consortium (W3C) a développé un ensemble de standards qui font autorité pour l'interopérabilité sémantique. Ces standards permettent la représentation, l'échange, le requêtage, le raisonnement, et la validation de connaissances en se basant sur des modèles de données orientés graphes. Les vocabulaires RDF (Resource Description Framework), les taxonomies SKOS (Simple Knowledge Organization System), les ontologies OWL (Web Ontology Language) permettent de définir et d'organiser les concepts importants d'un domaine, ainsi que les relations qui peuvent exister entre objets de ce domaine.

L'utilisation de vocabulaires de référence pour les métadonnées comme DCAT, schema.org, etc. est déjà omniprésente sur le Web, et l'utilisation d'ontologies pour structurer les données s'impose notamment via l'initiative du Linked Open Data. La stratégie européenne en matière de données promeut leur utilisation généralisée au sein même des espaces de données.

Quel rôle joue la normalisation européenne ?

Il apparaît évident que les organismes de normalisation, qu'ils soient internationaux ou européens comme le CEN, CENELEC, et l'ETSI, ont un rôle important à jouer pour faciliter l'interopérabilité. Les normes et spécifications techniques, surtout lorsqu'elles sont ouvertes comme c'est le cas pour celles de l'ETSI, facilitent le développement de services qui deviennent interopérables de fait.

Chaque année, la commission européenne publie son plan pour la normalisation des technologies de l'information et de la communication (Rolling Plan for ICT standardisation), comme une passerelle unique entre les politiques de l'UE et les activités de normalisation. Il contribue à accroître la convergence des efforts des normalisateurs en vue d'atteindre les objectifs politiques de l'UE. Pour la version 2023, 39 domaines technologiques ou d'application sont concernés, dans quatre domaines thématiques : catalyseurs clés (key enablers), défis sociétaux, innovation pour le marché unique, et croissance durable.

L'ontologie SAREF de l'ETSI et son utilisation par l'industrie

Dans le Rolling Plan for ICT 2023, on retrouve de nombreuses références à SAREF au chapitre du catalyseur clé IoT, et on en trouve également pour différents secteurs comme les réseaux électriques intelligents, les villes intelligentes, la digitalisation de la gestion de l'eau, ou encore le secteur de la construction et du BIM. 

Mais qu'est que SAREF et qui l'utilise ?

L'ontologie SAREF est développée par le comité technique SmartM2M. Elle est constituée d'un module noyau qui permet de décrire les dispositifs de l'IoT en termes de services et fonctions qu'ils exposent, et de paramètres physiques qu'ils peuvent mesurer ou actionner. Des extensions pour différents domaines ont été développées: énergie, environnement, bâtiment, ville intelligente, industrie et la fabrication, agriculture et alimentation, automobile, e-santé/le bien-vieillir, wearables (technologies portables), gestion de l'eau, ascenseurs. 

Source: https://portal.etsi.org/xtfs/#/xTF/653 

Des projets européens ambitieux inter-domaines utilisent SAREF comme ontologie de référence pour les données IoT échangées par les partenaires, et soumettent en retour leurs propositions d'améliorations à SAREF via l'ETSI. Par exemple entre énergie et bâtiments intelligents (InterConnect - Interoperable Solutions Connecting Smart Homes, Buildings and Grids, 35.8M€, 75 partenaires), énergie et ville intelligente (Platoon - Digital PLAtform and analytic TOOls for eNergy, 11.5 M€, 23 partenaires), énergie et électromobilité (OMEGA-X - Orchestrating an interoperable sovereign federated Multi-vector Energy data space built on open standards and ready for GAia-X, 10.2 M€, 30 partenaires), énergie et santé (SEMIoTICS - Smart End-to-end Massive IoT Interoperability, Connectivity and Security, 5M€, 10 participants).

Ces projets démontrent que SAREF est une ontologie clé pour l’interopérabilité sémantique des applications IoT dans et entre espaces européens des données.

SAREF évolue et se consolide

Le Data Act touche les nombreux secteurs où l'IoT joue un rôle grandissant. SAREF doit pouvoir évoluer avec agilité. Par conséquent, les spécifications techniques SAREF doivent évoluer de manière dynamique pour répondre aux nouveaux besoins et contributions de toutes les parties intéressées (du même domaine ou de domaines différents). Cela a nécessité de développer des façons efficaces de travailler.

Huit ans après le démarrage de son développement, l'ontologie SAREF continue de recevoir des contributions et des améliorations. Dès 2017, l'École des Mines Saint-Étienne, école de l'Institut Mines Télécom, s'est impliquée notamment dans  plusieurs task forces au sein de ETSI visant à consolider et étendre SAREF, et à spécifier la méthodologie et la mise en œuvre du développement de SAREF. Nos travaux ont conduit notamment à la mise en place d'une approche de type intégration continue et déploiement continu, et au déploiement du portail public de documentation de SAREF. Nous participons actuellement à deux STF (STF 641 et STF 653) qui visent à homogénéiser la structure des extensions de SAREF, notamment en utilisant la  notion de patrons d'ontologies. Ces travaux résulteront en la publication d'une nouvelle version majeure pour SAREF et chacune de ses extensions d'ici 2024. 

Source: https://portal.etsi.org/xtfs/#/xTF/653 

L'objectif final pour l'ETSI est de faire en sorte que SAREF soit facile à comprendre et à appliquer, et que les parties prenantes aient une vision claire de comment proposer des améliorations ou des extensions.