Comment garantir une expérience de data shopping fiable et conforme au respect de la vie privée ?

De plus en plus d'entreprises se tournent vers le cloud. Pour cause, ses avantages sont multiples et séduisants : réduction des coûts, flexibilité, amélioration des processus, et diminution des silos.

Les concepts structurels tels que le data mesh ou encore la démocratisation des données contribuent, grâce à des processus améliorés, à la mise en œuvre de la migration vers le cloud. En effet, le data mesh est une approche d'ingénierie sociale dans laquelle les équipes de développement sont responsables de l'aspect technique : elles développent l'architecture et exploitent elles-mêmes les systèmes. Dans cette démarche, la souveraineté des données incombe aux unités opérationnelles, car elles ont accès à ces données et les produisent dans la plupart des cas. La seconde approche, celle de la démocratisation de la data, définit quant à elle le mode de fonctionnement du traitement des données. Elle nécessite également une compréhension culturelle et des capacités techniques pour garantir à chacun la possibilité de collecter et d'analyser sans avoir recours à un soutien extérieur.

C'est dans ce contexte que survient la notion du « data shopping ». C’est une expérience qui simule des achats en ligne classiques. Concrètement, cela implique que les employés recherchent des données dans des catalogues, et sélectionnent des ensembles qui leur sont spécifiques. Cette démarche est onéreuse pour les entreprises, qui doivent accepter de mettre en place des systèmes permettant à leurs équipes de rechercher, trier, filtrer, comparer, sélectionner et demander l'accès au données – et ce, de manière fiable.
Cette transition pose un véritable défi aux entreprises. En principe, quatre points de blocage peuvent être identifiés à ce niveau :

  • La recherche et la compréhension des données : Le concept de data shopping fournit une interface intuitive permettant aux équipes d'identifier les données appropriées pour leurs analyses. Cependant, la compréhension des données reste une condition préalable à une utilisation fructueuse. Malheureusement, de nombreux projets échouent à ce stade, car plusieurs entreprises ne disposent pas d'une stratégie suffisamment solide pour améliorer la maîtrise des données à long terme. Selon une récente étude d'IDC, 65 % des entreprises peinent à identifier et à contrôler les sources de données de leur organisation.
  • La qualité et la transparence des données : Les données accessibles ne sont pas nécessairement de meilleure qualité. Même si cette problématique doit être traitée à un autre niveau, elle influe considérablement sur le succès d'une solution de data shopping.
  • La responsabilité des données : Malgré la facilité d'accès et les flux de données partiellement automatisés, les parties responsables doivent toujours s'assurer que les bonnes données sont disponibles sous la bonne forme et au bon moment. L’étude d'IDC révèle que 95 % des répondants font état de difficultés organisationnelles.
  • L'accès conforme à la protection des données : les données, en particulier celles à caractère personnel, sont soumises à un devoir de diligence à part entière. Il convient de s’assurer de leur protection à chaque instant.

L'identification et la protection des données sensibles

L'un des principaux défis du data shopping est l'accès réglementé aux données sensibles et leur utilisation. Les réglementations en matière de protection de la vie privée énoncent des mesures strictes pour les données sensibles telles que les informations personnelles identifiables (PII), ou les informations médicales protégées. Ces exigences placent les entreprises dans une situation délicate. Si un contrôle excessif est exercé sur l'utilisation des données sensibles, la capacité à en tirer de la valeur est alors compromise. Si les entreprises transfèrent leurs données dans le cloud sans mettre en place de politiques de contrôle, elles ne seront pas en mesure de faire évoluer rapidement l'accès à ces données après la migration. Et pour cause, dans le cas le plus défavorable, les équipes n'auront pas les bons accès, ce qui serait fatal pour l'entreprise qui dépend de ces analyses.

Une approche en trois étapes explique comment la gouvernance et la qualité des données peuvent garantir un accès conforme à la data et aux analyses dans le cloud :

  1. L'inventaire : la plupart des entreprises collectent des données depuis plusieurs années, et leur volume augmente de façon exponentielle ces derniers temps. En outre, leur écosystème de données est généralement constitué d'un système évolutif provenant de périodes différentes. Par conséquent, il est d’autant plus crucial de bien comprendre les données et leurs sources. Cette étape consiste également à répartir les responsabilités entre les différents départements. La systématisation des données lors de leur migration vers le cloud permet ainsi une utilisation conforme.
  2. La migration : la prise en charge et la transformation des données réglementées sont essentielles pour créer un contexte et identifier les données sensibles. Des outils peuvent aider à migrer les données de manière ordonnée et stratégique. Par exemple, ils peuvent permettre la création de nouvelles politiques et l'application dynamique à grande échelle. Les outils de ce type devraient aussi simplifier, normaliser et automatiser les contrôles et les politiques d'accès.
  3. Le répertoire : à titre d'exemple, un catalogue pour un data lake offrant un accès aux données sensibles en fonction des politiques, peut aider à structurer et à suivre leur gestion dans le cloud dès le départ. Les métadonnées et leurs classifications  alimentent le moteur de gestion des accès et les pipelines de données. Lorsque le data lake est doté de données partagées, celles-ci sont déjà conservées. Elles sont ainsi prêtes à être consultées et sont universellement accessibles.

La gouvernance des données est un élément clé de ce processus, et, en y accordant toute la rigueur nécessaire, il est possible d'offrir aux utilisateurs de données une « expérience d'achat » simplifiée leur permettant de : 

  • Découvrir par eux-mêmes les données disponibles,
  • Consulter de manière transparente le contexte des données, y compris les définitions et principaux paramètres commerciaux,
  • Comparer et sélectionner les données sans souci, car la protection des données est automatisée,
  • Avoir un accès libre à la data.

Tous ces avantages favorisent indéniablement la culture des données dans les entreprises et fournissent une approche structurée leur permettant de se mettre au diapason des données.