Quelles sont les analogies entre l'open data et l'open source ?
L'open data comme moteur de l'innovation dans les usages. Pourquoi rendre publique des données est un sujet délicat ?
Open Data : voici venu le temps de libérer les données !
Tout le monde connaît les logiciels libres, ces applications
ou ces services informatiques dont le code source peut être librement étudié et
modifié mais dont la redistribution est soumise au principe du « copyleft »
qui stipule qu’une fois modifié, le code doit rester ouvert. Alors que le
copyright classique restreint les droits d’utilisation, le « copyleft »
cherche à les préserver, un principe qu’incarne par exemple la licence GPL
(General Public License). Un principe similaire guide depuis quelques années un
mouvement similaire mais encore peu connu, celui de l’Open Data, qui vise à
rendre publics certains jeux de données tout en garantissant que d’éventuelles modifications
restent également ouvertes. Au plan légal la licence Open Database License
(ODbL) formalise les modalités du partage des données libres.
L’idée d’ouvrir des données préalablement inaccessibles pour
créer de la valeur et initier des synergies est bien antérieure à l’essor du Web. Historiquement, les deux principaux promoteurs d’une telle ouverture ont
été la communauté scientifique, il y a plus d’un demi-siècle déjà, puis, plus
récemment, les gouvernements des pays industrialisés. A l’origine, la
motivation des premiers était de minimiser les risques de pertes de données. Cependant,
c’est un souci d’équité dans l’accès à la connaissance et dans l’usage des
deniers publics qui a motivé la conclusion en 2004 d’un accord entre pays de
l’OCDE exigeant que toutes les données issues de la recherche publique soient désormais
librement accessibles. Dans un objectif de transparence et de modernisation de leur
action, de nombreux gouvernements ont à leur tour entamé une démarche de mise à
disposition sélective de certaines bases de données. En France, c’est le
service Etalab,
crée en 2011 et rattaché au premier ministre, qui est chargé d’appliquer la
politique d’ouverture des données. Il administre en particulier le portail data.gouv.fr ouvert au public et doté d’un
moteur de recherche. Notons que sur ces enjeux la France fait figure de moteur,
au G8 notamment, ce dont il est permis de se réjouir.
Quels bénéfices pour qui ?
En réalité ils sont variés et dépendent des protagonistes
concernés. Pour un gouvernement par exemple, l’ouverture de données permet de
rendre compte de son action auprès des citoyens. Henri Verdier, directeur de la
mission Etalab, esquisse même un nouvel idéal de transparence et de rigueur pour
un état moderne en imaginant que, dans un futur proche, chaque décision
gouvernementale puisse être étayée par le jeu de données qui l’a motivée.
Les
collectivités territoriales imaginent d’ores et déjà toute une panoplie de services
novateurs, du plus farfelu (les statistiques des prénoms des nouveau-nés
parisiens) au plus utile (la disponibilité en temps réel des places de parking
parisiens). Hormis les gouvernements et les organismes publics, les entreprises
peuvent également trouver un intérêt à l’ouverture de données qu’elles
souhaitent valoriser en faisant jouer la concurrence. Un consortium
d’entreprises touristiques pourra par exemple mettre à disposition des
listes d’hébergements, de moyens transports, d’évènements avec leur
disponibilité en temps réel. Ces informations pourront alors être exploitées par
les développeurs d’applications mobiles ou être proposées sur les sites des
tour-opérateurs.
Pourquoi tout n’est pas rose
Ouvrir des données auparavant masquées n’est toutefois pas
sans risques.
Le problème le plus sérieux est celui de l’anonymisation
obligatoire des données qu’imposent les lois de la CNIL. Ce problème est
d’autant plus épineux que des recoupements opérés entre plusieurs jeux de
données suffisamment détaillées permettent potentiellement d’identifier un
individu, et ceci même lorsque les données brutes sont elles mêmes anonymes.
Souhaitons
qu’en la matière le législateur et les experts techniques travaillent en bonne
intelligence pour parvenir à concilier nos libertés individuelles avec les
opportunités économiques qu’offre l’open data. D’autres problèmes, moins
graves, doivent aussi être pris en considération.
Pour être utiles, les données doivent se conformer à des formats standards et être
utilisables sans recours à une expertise trop importante, des exigences qui
peuvent impliquer des traitements coûteux. Enfin, il faudra désigner des
responsables qui garantissent la qualité et un rafraîchissement régulier des
données. Toutes ces tâches induisent évidemment des coûts qu’on aura intérêt à
prévoir dorénavant dès la conception des services. En réalité, c’est tout un ensemble de bonnes pratiques qu’il
s’agit d’inventer.
Des opportunités à saisir
L’open data pourrait bientôt jouer un rôle significatif comme
catalyseur de l’innovation, aussi bien au niveau technologique que dans les
usages. Ceux qui sauront exploiter cette nouvelle manne pour proposer des
applications mobiles innovantes y trouveront leur compte. Pour stimuler cette
créativité, certaines municipalités comme la ville de Nantes ont
lancé des concours d’innovations autour des nouveaux usages que permet l’open data, avec, reconnaissons-le,
des catégories et un palmarès qui n’ont rien à envier au festival de Cannes.
De
même, les prestataires de services qui, les premiers, seront à même de proposer
un éventail cohérent de services en relation avec ces problématiques trouveront
là une belle opportunité pour se démarquer. Nettoyage de données, conseil
juridique, mise en place d’une gouvernance, définition de bonnes pratiques,
harmonisation des formats techniques, développement d’applications : les
besoins ne manquent pas.
Combinées à la géolocalisation et aux possibilités de
traitement Big Data les perspectives de l’open data sont virtuellement
infinies. Comme dit le dicton : « l’imagination est la seule
limite ! »