Alors, qu’est ce que vous allez faire avec mes données ouvertes ?

A chaque fois que l’on discute avec quelqu’un intéressé par une ouverture de données, il ou elle finit par demander ce que serait l’impact. Il n’y a pas de réponse facile et cela dépendra essentiellement de la façon dont les données seront ouvertes...

L’Intelligence Artificielle est en train de remplacer le Big Data comme sujet le plus tendance dans le monde des technologies. C’est une bonne chose parce que nous devrions avoir maintenant le recul nécessaire pour comprendre plus précisément ce qu’est le Big Data. 

Ce qui a été remarquable dans la dernière décennie en terme de données, c’est la démocratisation à la fois des outils et des sources de données. 

Aujourd’hui, n’importe qui peut se brancher sur l’API de Twitter. Le coût de plus en plus marginal des composants des smartphones, a donné naissance à l’Internet des Objets. N’importe qui peut inclure un GPS et pléthore de composants très abordables à n’importe quel objet ; générant ainsi une quantité astronomique de données. N’importe qui a accès à une quantité phénoménale de données au quotidien, à moindre coût. 

De plus, on trouve désormais un ensemble complet d’outils, de tutoriels, de librairies et de livres pour analyser ces données. Il est possible de faire tourner des algorithmes de Machine Learning en quelques lignes de code. Et lorsque l’on est prêt pour passer en production, les technologies de Cloud Computing permettent de déployer des infrastructures énormes pour quelques centaines de dollars. 
La démocratisation des technologies des données est un changement de paradigme profond. Cela a permis à une grande quantité d’entreprise de mieux servir leurs clients, et à beaucoup d’administrations de mieux servir leurs administrés. N’importe qui peut apprendre, gratuitement, en ligne, comment gérer des données, comment les comprendre, comment les stocker, comment les partager et comment les grouper. 
Dans le même temps, des outils ouverts ou librement distribués comme les bases de données, les outils de parallélisation, les langages, et les librairies de visualisation de données sont disponibles. 
C’est génial. C’est la révolution du Big Data. Mais nous devrions aller beaucoup plus loin! 

Alors, qu’est ce que vous allez faire avec mes données ouvertes ?

A chaque fois que l’on discute avec quelqu’un intéressé par une ouverture de données, il ou elle finit par demander ce que serait l’impact. Il n’y a pas de réponse facile et cela dépendra essentiellement de la façon dont les données seront ouvertes. Si vous attendez des gens qu’ils réutilisent vos données ouvertes, il faut les mettre dans les conditions optimales avec le bon contexte et des outils qui leurs permettront d’être ouverts d’esprit — u sens originel du terme — à propos des données.

  1. L’Open Data de base — ’est à dire des jeux de données faciles à télécharger, dans des formats et licences standardisés — ’est pas suffisant. 
  2.  Les données ouvertes avec des outils pour les développeurs, comme des API donnent un plus grand spectre d’action. Mais seulement aux développeurs. C’est beaucoup mieux puisque les développeurs peuvent créer des applications et des services qui indirectement bénéficieront au gens. Mais cela n’est pas totalement satisfaisant.
  3. Les données simplement ouvertes, sans contexte, et surtout sans efforts pour fédérer une communauté autour, peuvent avoir le même effet qu’un arbre tombant au milieu de la forêt.

Essayer d’imaginer ce que seront les usages des jeux de données ouverts avant l’ouverture est une illusion. J’irais même plus loin, si vous êtes capables d’imaginer les usages à l’avance, c’est que vous avez échoué sur la planification et l’exécution de la démarche Open Data. Le jeu de l’ouverture de données consiste à distribuer un matériau, des outils appropriés et organiser un écosystème, une communauté, pour donner aux acteurs une raison de faire quelque chose des données, indépendamment des idées préconçues.

La connaissance, prête à l’emploi

Une fois que vous avez commencé a vraiment ouvrir des jeux de données, et que de vraies données sont disponibles, les circonstances sont globalement là. Il faut maintenir la confiance des utilisateurs.

Continuer à sortir des données et maintenir de bonnes relations avec la communauté est aussi très important. Mais quand même, généralement en ouvrant des données on crée de facto les circonstances de leurs réutilisation.

Le principal problème, selon moi, reste qu’il manque un élément dans la plupart des démarches Open Data : les instruments. Le web des données et l’open data 5 étoiles sont peut-être le meilleur moyen de donner les circonstances au consommateur de données. Mais le segment des personnes ayant les compétences pour en profiter semble trop petit. 

On peut espérer que les gens apprennent, on peut leur apprendre, mais je pense que nous avons le devoir de leurs donner les outils pour en profiter directement. L’Open Data est sur la bonne voie. Tous les jours de nouveaux jeux de données sont ouverts, c’est très enthousiasmant. Cependant, nous avons toujours beaucoup de travail pour permettre aux données d’exprimer leur potentiel. Vous ne pouvez pas sérieusement demander aux gens d’imaginer de nouveaux services avec vos données sans leurs donner à la fois les circonstances et les instruments. 

Commencez donc à ouvrir vos données tout de suite, apprenez vite et créez des relations réelles et honnêtes avec les gens. Vous aurez des résultats réels et honnêtes…