François Bancilhon (Data Publica) "L'open data sera l'un des enjeux de la présidentielle"

François Bancilhon, le fondateur de Data Publica présente sa start-up spécialisée dans la récupération, l'enrichissement et la visualisation de données en ligne qui profite de l'essor de l'open data.

JDN. Data Publica c'est quoi ?

François Bancilhon. Data Publica est un service de recherche et de visualisation de données en ligne. Initialement, il a été développé comme un projet de recherche et développement qui a été partiellement financé par un appel à projets innovants lancé par Nathalie Kosciusko-Morizet en 2009. Durant l'année 2010, nous avons développé dans le cadre de ce projet un premier portail qui recensait des données publiques accessibles via un moteur de recherche. Une première version a été mise en ligne en septembre 2010. Ce n'est que là que nous nous sommes posé la question du modèle économique. L'entreprise a été créée en mars 2011.

Quel constat vous a poussé à créer ce service ?

Il existe un réel besoin de la part des entreprises de se retrouver dans le fatras de données produites par des organismes privés ou publics. Nous voulions arriver à mettre un peu d'ordre dans ces données pour les rendre accessibles et compréhensibles. Dans cette optique, notre rôle est autant de fournir ces données que de fournir les outils permettant de les visualiser. Fin 2011, nous avons lancé un outil de visualisation générique de données, qui permet de façon interactive de mettre en forme et ainsi mieux comprendre les données que nous proposons.

Ces données existaient déjà. Quelle valeur leur apportez-vous ?

Le simple fait de recenser ces données et les rendre accessibles en un seul point apporte de la valeur à notre offre. L'autre point important est que nous harmonisons les données que nous collectons. Nous travaillons à la structuration de nos informations afin de permettre aux utilisateurs de faire des croisements et des alignements entre différents jeux de données. Aujourd'hui, nous fonctionnons surtout au cas par cas en fonction des données sur lesquelles nous travaillons. Notre objectif à plus long terme est de parvenir à industrialiser ces rapprochements, mais cela va prendre du temps.

Quelles données agrégez-vous ?

Depuis le lancement de Data Publica, nous avons rassemblé 13 000 jeux de données. Nous avons commencé à les rassembler à la main et nous avons cherché à industrialiser notre collecte. Nous avons par exemple aspiré l'ensemble des données d'Eurostat et de Data.gouv.fr. Nous récupérons également d'autres types de données sur Internet. Pendant les primaires socialistes, nous avons par exemple réussi à agréger les résultats des votes des militants. Nous espérons récupérer d'autres types de données comme cela. L'étape d'après est de parvenir à maintenir à jour les données que nous réunissons. Nous avons constaté que sur un corpus de jeux de données, en une année, 20% des jeux ont disparus.

Quel est votre modèle économique ?

Nous avons deux sources de revenus. La première consiste à fabriquer des jeux de données sur mesure pour des clients. Nous identifions les sources de données primaires qui permettent de donner accès à l'information que le client cherche. A partir de ces sources, nous produisons le jeu de données final. En général, les clients choisissent de prendre ces données en abonnement car ils ont besoin d'une mise à jour régulière de ces données.

L'autre source de revenus porte sur la mise à disposition de nos jeux de données dans notre Data store, qui est aux données ce que l'App Store d'Apple est aux applications mobiles. Nos clients peuvent acheter directement ces jeux de données qui sont généralement issues de producteurs tiers.

L'Etalab, l'organisme public en charge de l'harmonisation et de la diffusion des données produites par les administrations a lancé en décembre dernier son portail Open Data, Data.gouv.fr. Comment percevez-vous cette forme de concurrence ?

Etalab n'est pas un concurrent mais un facilitateur. La création de cet organisme est une bonne chose car elle permet d'accélérer la mise à disposition des données publiques. Nous avons même immédiatement aspiré leurs données pour les utiliser lorsque Data.gouv.fr a été lancé. Etalab a par ailleurs un rôle moteur pour convaincre les administrations d'ouvrir leurs données au public, ce qui est loin d'être un processus facile. Certaines entreprises publiques comme la SNCF ont adopté le concept en ouvrant leur propre portail open data. Mais de nombreuses administrations n'ont pas encore idée de ce qu'est l'open data.

L'open data n'intéresse-t-elle que les entreprises ?

Non. L'open data d'ailleurs sera l'un des enjeux de la présidentielle. Des candidats comme François Hollande ont fait des propositions concernant la transparence de l'administration et de l'action gouvernementale. La création de l'Etalab répondait également à ce besoin de transparence.

Data Publica est-elle une entreprise rentable ?

Nous ne communiquons pas sur nos résultats, mais nous sommes encore une jeune entreprise. Nous avons réalisé un tour d'amorçage d'environ 400 000 euros auprès du fonds IT Translation.

Prévoyez-vous de réaliser un second tour de financement ?

L'avenir le dira !

Diplômé de l'École des Mines de Paris, titulaire d'un PhD de l'Université du Michigan et d'une Thèse d'État de l'Université de Paris XI, François Bancilhon a connu une première carrière dans la recherche académique (Inria, MCC et Université de Paris XI) et un deuxième carrière dans l'industrie. Il a co-fondé et/ou dirigé plusieurs entreprises, (O2 Technology , Arioso, Xylème, Ucopia, Mandriva, Data Publica). Il est actuellement directeur exécutif de l'Initiative Services Mobiles pour l'INRIA, un groupement d'animation de l'éco-système mobile et CEO de Data Publica.