L'Open Data : les risques potentiels de l'ouverture des données publiques

Quelles sont les incidences et les risques liés à l'ouverture et la mise à disposition de données publiques à des tiers

Les activités de L'État sont à l'origine de la production d'une quantité considérable de données qualifiées de publiques lorsqu'elles sont produites dans le cadre de l'activité du service public. L'ouverture des données publiques appelée plus communément en anglais "Open data", consiste à mettre à la disposition de tous, sous une forme exploitable, le plus grand volume possible de données.

Les services de l'Etat et des collectivités locales ont du apprendre à favoriser la réutilisation de leurs données publiques. En effet, la loi du 17 juillet 1978 qui prévoit la liberté d'accès aux documents administratifs régulé par la Commission d'accès aux documents administratifs (CADA) a été modifiée en 2005 (transposition de la directive européenne du 17 novembre 2003) afin de prévoir un droit de réutilisation de ces données publiques. La loi précise que, pour se faire, les administrations sont libres de fixer des redevances qui doivent être décrites dans une licence fournie par l'établissement public aux réutilisateurs. En général, la réutilisation des données pour un usage non commercial sera libre de toute redevance.

Le système mis en place permet aux citoyens, aux acteurs économiques, aux chercheurs, ou à la presse de se saisir des données publiques. Dans une société où le web mobile se développe à grande vitesse, et où les technologies permettent un traitement rapide d'un grand nombre d'informations, la réutilisation des données publiques est riche de promesses (sont déjà mis en place un site sur l'activité de chaque député, une cartographie interactive des lieux accessibles aux personnes handicapées ou encore la disponibilité en temps réel des vélos en libre-service à Rennes ou à Bordeaux - villes pionnières en la matière). Le mouvement semble débuter en France.


L
a ville de Paris a lancé sa plateforme de données publiques Opendata.paris.fr le 27 janvier dernier et l'Etat, à l'instar d'autres pays comme les Etats-Unis ou le Royaume Uni, va se doter prochainement de son portail gouvernemental rassemblant les données publiques.

Le sujet semble donc faire consensus en ce qu'il permettrait la transparence de l'action administrative et le développement du marché de l'information. Il convient toutefois d'en mesurer les conséquences : « l'Open data » n'est pas sans comporter certains risques.

Les risques liés à la transparence
L'Open data peut être à l'origine d'un changement des rapports de force entre les citoyens et l'Etat quant aux décisions à prendre, et notamment quant à l'évaluation et la légitimité des politiques de service public et de leur efficacité en fonction des données chiffrées disponibles. Face aux données, le citoyen sera tenté de discuter du bien fondé de chaque décision. Si le citoyen a bien évidemment un droit de regard sur la dépense publique, il pourra être contesté le fait qu'il dispose des compétences nécessaires pour évaluer tel ou tel projet. A titre d'exemple, serait alors discuté la nécessité d'ouvrir ici ou là une école, une maison pour jeunes, ou un bureau de poste en fonction des données démographiques fournies. Le gouvernement pourrait donc être confronté à une perte de pouvoir sur les données et sur la prise de décision en général.

Par ailleurs, les réutilisateurs peuvent aussi détourner les informations fournies afin de produire des sites intrusifs ou discrimimants et source d'inquiétudes pour les citoyens.  L'exemple des Etats-Unis, où les réutilisateurs se sont rués sur les données de criminalité pour produire des cartographies par ville ou recensant l'origine ethnique des habitants d'un quartier, est souvent décrié.

Enfin, l'ouverture de ces données pourrait avoir pour conséquence sur le long terme la privatisation des services publics. En effet, l'accès à ces données et leur réutilisation par des entreprises privées pourraient laisser penser que l'Etat n'a plus le monopole des services publics, le privé pouvant alors assumer certaines fonctions, et notamment la production de données publiques pertinentes agencées et remaniées en leur faveur. L'exigence de clarté et de transparence ne pèse dès lors que sur le secteur public. Pourtant, la communication de leurs données par les entreprises privées pourrait aussi s'avérer aussi fort utile : l'exemple est souvent donné des opérateurs de télécommunications qui disposent de données anonymes précises sur la fréquentation des quartiers de la ville, sur le trafic sur les grands axes routiers, ainsi que des fournisseurs d'énergie ou des entreprises de collecte des déchets. Dès lors, n'existe-t-il pas un risque de déséquilibre entre l'administration dont le travail est totalement dévoilé et les entreprises privés qui continueront à garder la maîtrise de leurs données?

Les risques liés à la vie privée
Certaines données ne sont pas concernées par ce mouvement d'ouverture : les informations détenues par des organismes culturels ou d'enseignements et de recherche, les données sur lesquelles des tiers détiennent des droits de propriété intellectuelle, et naturellement les documents contenant des données personnelles.

Toutefois, il est parfois délicat de faire la part entre données publiques et données personnelles. Le débat suscité par l'adoption de la LOPPSI en témoigne. En effet, son article 30ter introduit au Sénat a particulièrement suscité de vives réactions puisque cet article menaçait fortement l'Open data en France en proposant de soumettre les réutilisateurs de données publiques sous licence à un contrôle de comportement (de moralité). Plusieurs amendements ont été déposés par des députés de droite comme de gauche en vue de rectifier le tir. Un amendement de la commission des lois a été adopté afin de  restreindre ces contrôles de moralité à la seule réutilisation des données d'immatriculation des véhicules.

En effet, l'Open data ne subissait ici que le dommage collatéral de la légalisation d'une pratique : l'utilisation et la vente par l'État des données personnelles relatives aux cartes grises à des fins de marketing. Une confusion entre données personnelles et publiques est créée. Il existe donc un risque certain pour que l'Open data concerne parfois des données pouvant être qualifiées de personnelles puisque même pour le législateur la confusion est de mise.

Les risques liés à la marchandisation des données
Dans le cadre de sa mission de mise en valeur du patrimoine numérique public, l'Agence du patrimoine immatériel de l'Etat (APIE) a proposé deux modèles de licences de réutilisation des données publiques basées sur le paiement de redevances, sauf dans l'hypothèse d'une réutilisation non commerciale. Cette orientation consistant à marchander les données publiques, alors qu'elles sont le fruit de l'exercice du service public financé par tous n'est pas exempt de risques.  En effet, il ne faudrait pas qu'un tel système empêche les petits acteurs d'obtenir une licence car trop chère.

Ceci créerait un déséquilibre entre les grandes entreprises pouvant librement s'offrir des données publiques exploitables et les petites ne pouvant y accéder. La question de la tarification est donc centrale, et la réutilisation des données par un maximum d'acteurs en dépendra. Le risque étant que l'exploitation de ces données ne soit réservée qu'à des lobbies qui, grâce à leur puissance et leurs moyens financiers, en fassent un usage à leur avantage au détriment des instituts publics de production de données géographiques ou statistiques qui faute de budget devront diminuer leurs activités. Afin d'éviter ce risque, certains préconisent l'utilisation de modèles de licences libres mis en place à l'étranger.

Les risques liés à la fiabilité et à la complexité des données
Un autre risque est qu'en ouvrant au public ces données, soit révélé leur manque de fiabilité. Ce qui pourrait discréditer l'action publique et remettre en cause le travail effectué par les administrations.

Par ailleurs, les données pourraient aussi être difficiles à comprendre car trop complexes, si bien que les dépenses mises en oeuvre par l'Etat pour assurer leur mise à disposition du public ne serviraient pas au citoyen qui ne peut les interpréter mais uniquement à des spécialistes, souvent financés par des entreprises puissantes. Ici encore, un déséquilibre dans l'accès aux données pourrait naître. A terme, on pourrait redouter que ces entreprises falsifient les données avant de les communiquer au public afin de les tourner à leur avantage...

Les risques liés à une utilisation massive et abusive  des données
Une des plus grandes craintes soulevée par les observateurs de l'Open data est la peur de voir des entreprises étrangères profiter à moindre cout de ces données pour en faire un usage commercial, parfois abusif en ce qu'il serait à la limite du pillage. Les données publiques françaises seraient alors exploitées par des groupes étrangers sans que cela ne rapporte de bénéfices à l'Etat puisque le propre de ces entreprises est de ne pas payer d'impôts en France. L'exemple constamment cité est celui de Google qui est souvent accusé de « pillage » en raison de ces litiges l'opposant aux titulaires de marques ou aux éditeurs. Ce risque d'exploitation massive voire intrusive des données, souvent mis en avant par les partisans d'un discours protectionniste, ne doit pas être exclu.

L'affaire Wikileaks a montré que l'ouverture des données publiques est un sujet plus qu'épineux. La France a toujours été réticente à diffuser volontairement ses données publiques, pourtant le mouvement semble en marche. Il faut donc désormais compter sur la bienveillance de tous les acteurs (réutilisateurs et pouvoirs publics) afin de contenir, ou du moins limiter, les risques évoqués afin de faire de l'Open data un mouvement juste et équilibré.