Gorgées de données, les villes cherchent à révéler leurs secrets 

Gorgées de données, les villes cherchent à révéler leurs secrets  Après avoir mis en place des infrastructures de collecte et de partage de données, les collectivités se tournent vers des outils d'analyse afin de mieux cerner les besoins de leurs territoires.  

Les villes sont assises sur des montagnes de données, reste à savoir quoi en faire. Durant la précédente mandature, les grandes métropoles françaises, ainsi que certains départements et régions, ont mis en place des politiques de la donnée de plus en plus robustes. Leurs portails open data sont de plus en plus fournis grâce à des automatisations des remontées de données publiques sur ces plateformes, mais aussi à l'arrivée de nouvelles sources avec l'installation de capteurs IoT.

"40% de nos clients consomment et republient des données venant d'autres administrations"

De premiers exemples de partages de données d'intérêt général du secteur privé avec la puissance publique commencent aussi à émerger. On peut citer la ville de Paris, qui a forcé les opérateurs de trottinettes à lui fournir des données en temps réel sur l'utilisation et la taille de leur flotte. Ou encore le projet Occitanie Data, un cadre de confiance de partage des données de la région avec des entreprises locales comme Airbus ou Sopra Steria ainsi que des sociétés médicales et pharmaceutiques. Jugée concluante, l'expérimentation sera transformée en structure pérenne. 

Ces collectivités ne cherchent plus seulement à mettre leurs données en libre accès, mais à constituer des bases de données exhaustives de leurs territoires. "Aujourd'hui, 40% de nos clients consomment et republient des données venant d'autres administrations", explique Jean-Marc Lazard, PDG de la start-up OpenDataSoft, qui développe des portails open data et des outils de data-visualisation pour les collectivités. "Il ne s'agit pas seulement d'une ville qui va récupérer les données de son département ou sa région la concernant. Vous pouvez aussi croiser ces données avec celles d'Infogreffe sur les créations d'entreprises, de l'Urssaf, du découpage administratif..." 

Merci le covid

Des infrastructures et des outils dont certains ont pu mesurer l'intérêt durant la première vague de coronavirus. Des villes comme Lille, Orléans ou Dunkerque ont publié sur leurs portails open data des données de crowdsourcing (renseignements fournis par la population) sur les commerces ouverts, ceux pratiquant le click and collect ou encore les producteurs de fruits et légumes livrant à domicile. Des données qui ont ensuite été intégrées à des cartes interactives pour informer les habitants via les sites et applis des collectivités.

"Même les plus grandes villes ont encore des problématiques de récolte, d'exhaustivité et de qualité des données" 

"Rendre publiques des données crowdsourcées sans les vérifier, ce n'est pas dans la nature des collectivités habituellement", remarque Jacques Priol, fondateur de la société de conseil Civiteo, qui accompagne les collectivités dans leurs politiques de la donnée. D'autres villes comme La Baule ont détourné leur système d'information touristique, habituellement réservé aux hôteliers et restaurateurs, pour l'ouvrir à l'ensemble des commerçants de la ville durant la pandémie. 

"Ces sujets de plateformes et de données n'étaient pas toujours sur le haut de la pile dans certaines collectivités. Tandis que d'autres, qui n'en voyaient pas du tout l'utilité, ont compris l'intérêt pour une municipalité d'organiser l'information et la collecte de données sur son territoire," se réjouit Jean-Marc Lazard. Covid ou pas, les bonnes pratiques sont toujours loin d'être homogènes, tempère Cedric Verpeaux, responsable des investissements innovants à la Caisse des dépôts. "Les données ne sont pas encore totalement industrialisables, même les plus grandes villes ont encore des problématiques de récolte, d'exhaustivité et de qualité des données." 

Modéliser, influencer, évaluer

A présent, la question qui travaillera les nouvelles mandatures élues cette année sera celle de l'analyse toujours plus fine de ces données. Selon Jacques Priol, le nombre de collectivités qui achètent des prestations de gestion de la donnée en France est passé d'une vingtaine en 2019 à une centaine cette année. Ces outils, liés à une collecte massive de données, servent trois buts, explique-t-il : "Modéliser les usages, modifier les comportements et évaluer l'impact des politiques publiques. Par exemple, les premières études sérieuses depuis le coronavirus montrent qu'il y a plus de voitures, et moins de gens dans les transports en commun. On glorifie l'augmentation de la pratique du vélo, alors que si on regarde l'ensemble du tableau, il se produit l'inverse de ce que veulent les villes : moins de voitures et plus de gens dans les transports."

Autre nouvel usage à travailler, celui de la prédiction. "On peut commencer par développer des projections statistiques en croisant les données de la ville et des indicateurs, par exemple pour se projeter dans les deux ou trois prochains mois durant cette période d'incertitudes," explique Jean-Marc Lazard. Puis dans un second du temps, du machine learning pourrait découvrir des corrélations insoupçonnées par les études statistiques traditionnelles, poursuit-il. 

"Même une ville comme Boston n'arrive pas à retenir un data scientist plus de six mois"

Mais ces ambitions se heurtent pour le moment à une réalité RH et financière. Les profils maîtrisant ces compétences de pointe, comme les data scientist, sont difficiles à recruter. Dans le privé, la compétition pour les attirer est féroce, tirant leurs salaires à la hausse, et rendant la mise difficile à suivre pour le secteur public. "Même si la collectivité se met au niveau salarial du privé, le manque de structuration ou de moyens peut rebuter les talents", ajoute Jean-Marc Lazard. "Par exemple, même une ville comme Boston n'arrive pas à retenir un data scientist plus de six mois." Pour réussir à recruter, certains villes comme Paris, misent sur des jeunes pas encore trop portés sur le salaire, explique Emmanuel Grégoire, premier adjoint de la maire de Paris. "Nous essayons d'attirer de jeunes profils talentueux qui auront tout le temps de gagner de l'argent plus tard en leur montrant l'intérêt pour leur carrière de passer par une mission de service public et en leur offrant un terrain de jeu très large en termes de données. "

Un manque de ressources humaines, mais aussi d'utilité ? Pour Cédric Verpeaux, il manque encore "une killer app ou killer fonctionnalité qui motiverait davantage de collectivités à réaliser des analyses de données plus élaborées." "Au contraire, il faut partir des besoins réels et revenir à des sujets proches des métiers des collectivités, comme la maintenance urbaine proactive ou les analyses d'impact économique et social", estime Jean-Marc Lazard. Techno-fantasme ou numérique pragmatique, les données ont en tout cas de quoi faire gamberger les villes pour les six prochaines années.