Pourquoi une gouvernance de la donnée ?

La data est au cœur du business des entreprises. Mais autant pour assurer un traitement qualitatif des informations recueillies que pour garantir leur confidentialité, la question de la mise en place d'un système de gouvernance de la donnée n'en est plus une : elle s'impose.

Poussé par les évolutions technologiques, le volume des données générées par l’activité humaine est toujours de plus en plus important. Des chiffres circulent : la somme des données collectées dans le monde en 2015 représentait environ 8 zettaoctets (source : Gartner), contre 1,8 en 2011 et 35 prévus en 2020 (source : IDC).

Les entreprises n’échappent pas à cette avalanche ! Cela leur offre de nouvelles perspectives  en matière de connaissance du client, de développement de nouveaux services et d’intelligence économique. Ces usages, créateurs de nouveaux revenus, donnent une valeur importante aux données.

Par exemple, on assiste au développement de projets tels que « la connaissance du client à 360° », la  voiture connectée, le  « pay as you drive » dans l’assurance ou encore la fabrication de médicaments sur mesure dans le domaine de la santé. Ces projets, qui  offrent des services innovants et à forte valeur ajoutée, génèrent déjà ou généreront des volumes considérables de données.

Ces données doivent être exploitées au mieux afin de pouvoir en tirer tout le bénéfice attendu. Elles sont stockées dans des systèmes d’information, riches de tout leur historique, et par là même héritant en général d’un niveau de complexité élevé. La multiplicité des applications du SI, des référentiels et des interfaces peut faire peser des problèmes importants sur les données.

Dans ce contexte, la problématique de leur qualité se pose de manière cruciale : par exemple, comment s’assurer qu’une donnée est exacte ou qu’elle a bien le niveau de fraîcheur attendu ? Comment garantir qu’une donnée est bien unique ou encore qu’elle n’a pas été modifiée de manière inappropriée ? Sur quel périmètre d’activité ou d’indicateurs peut-on se contenter de données partiellement complètes voire en partie estimées ?

Garantir l’exactitude, l’intégrité ou le bon niveau de fraîcheur et de complétude d’une donnée nécessite un ensemble d’actions de saisie et de vérification à travers des processus et  outils dont la mise en place constitue de véritables projets. Ces projets peuvent représenter une charge importante, voire très importante.  Il convient de se concentrer en priorité sur l’amélioration des données ayant une valeur importante pour l’entreprise (et cela nécessite de définir en amont ces données prioritaires parmi toutes les données disponibles).

Les données générées par l’entreprise portent aussi de nombreux risques, comme ceux associés à leur propriété, à l’image de l’entreprise ou à la conformité aux réglementations. Par exemple, la réglementation Solvency 2 exprime des exigences de qualité et garantie élevées sur les données financières des acteurs de l’assurance. Le développement du « Software as a Service » pose aussi la question de la propriété et du devenir des données générées par l’entreprise sur internet, ces données n’étant pas stockées dans les datacenters de l’entreprise. Que deviennent les données quand l’entreprise change de fournisseur de Saas ? Enfin, la divulgation et l’exposition à l’extérieur de certaines données, pas suffisamment validées, protégées ou sécurisées, peut dans certains cas dégrader de manière préjudiciable l’image de l’entreprise.

Comme nous venons de le voir, les risques qu’elles portent et la valeur qu’elles peuvent offrir font que les données sont un actif important de l’entreprise. Comme pour tout actif important, cela justifie pleinement d’en mettre en place la gouvernance.

Cette gouvernance des données permettra d’identifier, classer, piloter et contrôler les données à travers des processus, acteurs et instances de décision clairement définis et partagés au sein de l’organisation. Elle  permettra de définir et piloter les règles, processus et outils permettant de garantir qu’on se focalise d’abord sur les données à forte valeur pour l’entreprise, puis qu’on organise et coordonne les moyens pour produire et mettre à disposition des données ayant le niveau de qualité requis.