Quelles sont les analogies entre l'open data et l'open source ?

L'open data comme moteur de l'innovation dans les usages. Pourquoi rendre publique des données est un sujet délicat ?

Open Data : voici venu le temps de libérer les données !

Tout le monde connaît les logiciels libres, ces applications ou ces services informatiques dont le code source peut être librement étudié et modifié mais dont la redistribution est soumise au principe du « copyleft » qui stipule qu’une fois modifié, le code doit rester ouvert. Alors que le copyright classique restreint les droits d’utilisation, le « copyleft » cherche à les préserver, un principe qu’incarne par exemple la licence GPL (General Public License). Un principe similaire guide depuis quelques années un mouvement similaire mais encore peu connu, celui de l’Open Data, qui vise à rendre publics certains jeux de données tout en garantissant que d’éventuelles modifications restent également ouvertes. Au plan légal la licence Open Database License (ODbL) formalise les modalités du partage des données libres.
L’idée d’ouvrir des données préalablement inaccessibles pour créer de la valeur et initier des synergies est bien antérieure à l’essor du Web. Historiquement, les deux principaux promoteurs d’une telle ouverture ont été la communauté scientifique, il y a plus d’un demi-siècle déjà, puis, plus récemment, les gouvernements des pays industrialisés. A l’origine, la motivation des premiers était de minimiser les risques de pertes de données. Cependant, c’est un souci d’équité dans l’accès à la connaissance et dans l’usage des deniers publics qui a motivé la conclusion en 2004 d’un accord entre pays de l’OCDE exigeant que toutes les données issues de la recherche publique soient désormais librement accessibles. Dans un objectif de transparence et de modernisation de leur action, de nombreux gouvernements ont à leur tour entamé une démarche de mise à disposition sélective de certaines bases de données. En France, c’est le service Etalab, crée en 2011 et rattaché au premier ministre, qui est chargé d’appliquer la politique d’ouverture des données. Il administre en particulier le portail data.gouv.fr ouvert au public et doté d’un moteur de recherche. Notons que sur ces enjeux la France fait figure de moteur, au G8 notamment, ce dont il est permis de se réjouir.

Quels bénéfices pour qui ?

En réalité ils sont variés et dépendent des protagonistes concernés. Pour un gouvernement par exemple, l’ouverture de données permet de rendre compte de son action auprès des citoyens. Henri Verdier, directeur de la mission Etalab, esquisse même un nouvel idéal de transparence et de rigueur pour un état moderne en imaginant que, dans un futur proche, chaque décision gouvernementale puisse être étayée par le jeu de données qui l’a motivée.
Les collectivités territoriales imaginent d’ores et déjà toute une panoplie de services novateurs, du plus farfelu (les statistiques des prénoms des nouveau-nés parisiens) au plus utile (la disponibilité en temps réel des places de parking parisiens). Hormis les gouvernements et les organismes publics, les entreprises peuvent également trouver un intérêt à l’ouverture de données qu’elles souhaitent valoriser en faisant jouer la concurrence. Un consortium d’entreprises touristiques pourra par exemple mettre à disposition des listes d’hébergements, de moyens transports, d’évènements avec leur disponibilité en temps réel. Ces informations pourront alors être exploitées par les développeurs d’applications mobiles ou être proposées sur les sites des tour-opérateurs.

Pourquoi tout n’est pas rose

Ouvrir des données auparavant masquées n’est toutefois pas sans risques.
Le problème le plus sérieux est celui de l’anonymisation obligatoire des données qu’imposent les lois de la CNIL. Ce problème est d’autant plus épineux que des recoupements opérés entre plusieurs jeux de données suffisamment détaillées permettent potentiellement d’identifier un individu, et ceci même lorsque les données brutes sont elles mêmes anonymes.
Souhaitons qu’en la matière le législateur et les experts techniques travaillent en bonne intelligence pour parvenir à concilier nos libertés individuelles avec les opportunités économiques qu’offre l’open data. D’autres problèmes, moins graves, doivent aussi être pris  en considération. Pour être utiles, les données doivent se conformer à des formats standards et être utilisables sans recours à une expertise trop importante, des exigences qui peuvent impliquer des traitements coûteux. Enfin, il faudra désigner des responsables qui garantissent la qualité et un rafraîchissement régulier des données. Toutes ces tâches induisent évidemment des coûts qu’on aura intérêt à prévoir dorénavant dès la conception des services. En réalité, c’est  tout un ensemble de bonnes pratiques qu’il s’agit d’inventer.

Des opportunités à saisir

L’open data pourrait bientôt jouer un rôle significatif comme catalyseur de l’innovation, aussi bien au niveau technologique que dans les usages. Ceux qui sauront exploiter cette nouvelle manne pour proposer des applications mobiles innovantes y trouveront leur compte. Pour stimuler cette créativité, certaines municipalités comme la ville de Nantes ont lancé des concours d’innovations autour des nouveaux usages que permet l’open data, avec, reconnaissons-le, des catégories et un palmarès qui n’ont rien à envier au festival de Cannes.
De même, les prestataires de services qui, les premiers, seront à même de proposer un éventail cohérent de services en relation avec ces problématiques trouveront là une belle opportunité pour se démarquer. Nettoyage de données, conseil juridique, mise en place d’une gouvernance, définition de bonnes pratiques, harmonisation des formats techniques, développement d’applications : les besoins ne manquent pas.
Combinées à la géolocalisation et aux possibilités de traitement Big Data les perspectives de l’open data sont virtuellement infinies. Comme dit le dicton : « l’imagination est la seule limite ! »