Data governance et data quality : comment les mettre en place ?

De quelles données vont avoir besoin les équipes marketing ? Quels sont les objectifs de la collecte ? Quelle est leur provenance ? Avant de répondre à ces questions, il faut s'interroger sur l'accessibilité de ces données et leur qualité.

Pour devenir data driven, c'est-à-dire mettre la data au cœur de tous process, charge aux responsables data de faire tomber toutes les cloisons qui empêchent la bonne circulation et mise à disposition des données aux équipes. Il s’agit également de tout mettre en œuvre pour garantir la disponibilité, l’utilisabilité, l’intégrité mais aussi la sécurité des données.

Les 3 dimensions indispensables de la data gouvernance.

La dimension organisationnelle de la data.

Le préambule de la data gouvernance repose sur l'évangélisation autour des sujets de la donnée et de sa qualité. Tous les services de l'organisation sont concernés, de la direction aux opérationnels en passant par les managers. Ils doivent comprendre les enjeux que représentent la donnée pour l'entreprise, les bénéfices de son partage, les gains opérationnels engendrés grâce à la fin des structures en silos : un processus de transformation de données brutes en données activables engagé par une équipe A et qui serait également utile pour l'équipe B. Il faut aussi leur exposer les potentiels risques à exploiter des data non fiables.

Le second point est la nomination d’un référent comme principal interlocuteur concernant les sujets Data. Il est le garant de la communication, de la documentation. C'est à lui qu'incombe la responsabilité de s'assurer que les critères de qualité de la donnée sont bien respectés.

La dimension opérationnelle de la data.

Lorsque l'on parle de circulation et mise à disposition de la donnée, cela va au-delà du simple fait de rendre tous les outils accessibles à tous les collaborateurs. Dans le cadre d'une stratégie data, il y a des basiques : l'utilisation d'une solution de digital analytics telle que Google Analytics pour analyser les comportements internautes et les résultats des campagnes marketing ; le recours à un tag management system (TMS) pour organiser le déclenchement des tags...

Il faut arrêter de penser que les équipes data, marketing et IT travaillent en autarcie. L'heure est à la collaboration. Les outils doivent être accessibles aux collaborateurs consommateurs de data, (et uniquement à eux) car plus il y a d'intervenants, plus il y a de risques d'erreurs et plus les process de communication sont complexifiés.

En parallèle, de nouveaux outils seront certainement nécessaires pour simplifier la centralisation des données qui peuvent parfois venir d'horizons très différents : data magasin comme les tickets de caisse, digitale avec le comportement client... Les customer data platform (CDP) ont pour mission de lire et réunifier les données des différents points de collectes, aux formats différents et appelés via différents moyens (API, FTP, cloud...). Le recours à un outil de data quality est également indispensable à la mise en place d’outils martech et à leur rentabilité. Sans ce contrôle qualité de la donnée, le pilotage des campagnes marketing ne pourra pas être optimum.

La communication autour de la donnée

La première chose à faire lorsque l'on implique des interlocuteurs de différents univers sur un même projet est de s'assurer que tous parlent bien le même langage. Il sera alors du devoir du référent de mettre en place une documentation autour de la data. En plus d'un glossaire pour éclaircir les terminologies et simplifier les échanges entre les différents intervenants, on retrouvera notamment:

  • Le cahier des charges d'une donnée de qualité : elle doit être accessible par tous les consommateurs de data. Fiable car contrôlée avant exploitation. Pertinente, car à quoi bon mettre en place tous ces process si les données ne sont finalement pas utilisées...
  • Les métadonnées : chaque donnée collectée doit avoir une "fiche d'identité" comportant des informations sur son origine, sa date de création et son créateur, sa durée de conservation ...
  • Les objectifs de la donnée : à qui va-t-elle servir ? Dans quel contexte ? Pour quelle finalité ? 
Ajouter de la qualité dans vos données

Opérer tous les changements évoqués ci-dessus n'aura aucun intérêt si la notion de qualité ne fait pas partie intégrante du projet. 

Contrôler la qualité des données avant de les exploiter est inévitable pour garantir le pilotage des campagnes marketing. Ce sont ces mêmes data qui vont définir les opérations de promotion à déployer, inciter à cibler un segment de l’audience plutôt qu’un autre, pousser à apporter certains changements sur le site internet en vue d’une meilleure expérience client... Si la direction marketing ne peut pas faire confiance aux données qu’on lui communique, alors cette data n’a pas de valeur.

Des outils sont mis en place par les équipes pour orchestrer et documenter les collectes de données. Les plans de taggages. Contrôler régulièrement et intégralement la bonne implémentation du dispositif de tags et les données qu’ils transmettent aux partenaires marketing sont inévitables. C’est la qualité de toutes la chaîne data qui est en jeu.

Mais un site internet évolue et son tracking aussi. Ces gestionnaires de données sont en quelque sorte victimes d’obsolescence programmée. Ce risque impose d’effectuer des vérifications régulières et par conséquent automatisées des plans de marquage.  En effet, au vu de la charge de travail mais aussi du caractère fastidieux que cela représenterait pour les équipes, effectuer la recette manuellement n’est pas envisageable.

Le concept GIGO

Le concept de "garbage in -garbage out" consiste à dire que tout ce qui est erroné à l’entrée d'un process, le sera forcément à sa sortie. En d'autres termes, baser le pilotage marketing sur des données dont le niveau de qualité n'a pas été vérifié aboutira inévitablement à des prises de décisions inefficaces avec un impact direct sur le R.O.I.

C’est pourquoi la démarche de data quality doit intervenir au tout début et tout au long de de la chaîne data et être un prérequis à la mise en place d’outils de centralisation de la donnée telles que les DMP, et tout outil de collecte de données.

En plus d'être indispensable, la data quality doit devenir l'affaire de tous. Elle doit être mesurée grâce à la mise en place et au suivi de KPI qualité. La constitution d'un comité de suivi peut être utile pour définir la roadmap des chantiers data en corrélation avec la stratégie globale de l'entreprise.