Les entreprises ont-elles besoin de données unifiées pour innover ?

Les entreprises qualifiées de data centric ont la capacité de recenser, analyser et exploiter les données, qui sont la ressource la plus précieuse des organisations performantes. Cette anticipation permet notamment une prise de décisions concrète et plus rapide.

Les entreprises découvrent continuellement de nouvelles données. Ces data sources sont contenues au sein d’applications, de services web ou d’écosystèmes internes et stockées dans des data lake ou des espaces excentrés. Les organisations se développent et peuvent procéder à des fusions et acquisitions, acheter des données sur des places de marché, auprès de data broker ou encore des réseaux sociaux. Bien que cela soit essentiel pour avancer, cela génère habituellement de nouveaux silos de données à intégrer.

Selon l’étude Data Paradox, 60% des chefs d’entreprise décrivent les silos comme un obstacle majeur à l’amélioration de la collecte, de l’analyse et de l’exploitation des données, ce qui en fait le deuxième obstacle le plus important. Les organisations doivent être préparées à de nouveaux afflux de silos de données et à unifier leurs données au moment adéquat afin de réduire les risques. 

Fusions et acquisitions

Les grandes entreprises, en particulier dans les secteurs très réglementés comme la finance et l’assurance, consacrent les moyens nécessaires pour se conformer aux réglementations. Toutefois, ces efforts peuvent être compromis lorsque les organisations procèdent à une fusion / acquisition car de nouveaux ensembles de données s’ajoutent dans les entités commerciales. 

Selon l’étude Forrester, 70% des hauts responsables qui considèrent les silos de données comme un obstacle attribuent leur prolifération aux fusions et acquisitions. Cela est en partie dû aux différents formats et structures de données. Chaque entreprise peut opérer dans le même secteur, mais les données seront distinctes et organisées en conséquence. 

Des circonstances extérieures peuvent créer des silos de données, malgré tous les efforts déployés par une entreprise pour unifier ses données. En effet, le rapprochement des silos après une fusion n’est pas une tâche aisée et nécessite un investissement important.

Le rapprochement des silos peut comporter des défis si l’organisation acquise n’a pas de processus de traçabilité des données. Les entreprises se heurteront notamment à un problème de confiance. Comment se fier aux informations et utiliser des données dans de nouveaux projets si l’origine est inconnue ? D’autant plus que ces dernières peuvent différer selon le lieu et la raison de leur création. La fiabilité des données repose sur la reconnaissance et l’utilisation d’outils destinés à mesurer la provenance des données, le contexte de leur création et leur finalité. 

Marchés de données

Les entreprises optent pour la location des données afin de tester des modèles, construire des algorithmes et prendre des décisions pertinentes. A l’image des agences de publicité et de marketing qui louent des informations pour enrichir leur compréhension des comportement clients.

Toutefois, l’achat de données sur des places boursières peut présenter des inconvénients. Tout d’abord, il s’agit souvent d’actifs isolés – l’origine des données est généralement implicite et il peut être difficile de prouver leur traçabilité. Ensuite, les entreprises qui vendent des informations peuvent fournir des données sous différents formats. Les organisations doivent alors transformer et nettoyer les données avant de les utiliser pour faciliter les processus décisionnels.

Des normes d’interaction, de traçabilité et de gouvernance doivent être mises en place afin de savoir où les informations sont passées et qui les a consultées. Sans ces éléments, les dirigeants pourraient s’exposer à de nombreux risques. À l’heure actuelle, 40% des personnes interrogées dans le cadre de l’étude Forrester, pensent que le marché des données crée davantage de silos car la traçabilité est souvent inconnue. 

La CNIL (Commission Nationale de l'Informatique et des Libertés) qui veille à la protection des données personnelles contenues dans les fichiers et traitements informatiques ou papiers, aussi bien publics que privés et l’Union européenne, par le biais des exigences de conformité définies dans le Règlement général sur la protection des données (RGPD), sont des exemples concrets des progrès réalisés par des initiatives publiques. 

D’autres projets dans le secteur technologique soutiennent également ces efforts afin de créer une compréhension immuable des données. Par exemple, la Data Confidence Fabric et sa façon normalisée de tracer, quantifier et mesurer les données offre une connaissance approfondie des endroits où les données ont transité et de leur niveau fiabilité.

Les organisations doivent continuellement s’engager dans le maintien et l’évaluation des différentes normes à travers l’écosystème interne et externe.

Écosystèmes internes

Les bases de données des entreprises ont pour objectif de fournir des descriptions, les modes d’utilisation et de stockage des données. Ces définitions permettent de créer une compréhension et une structure ponctuelles qui réduisent les silos. Cependant, de nouveaux types d’informations sont constamment créés. Des défis peuvent alors survenir lorsque les organisations adoptent de nouvelles technologies ou effectuent des mises à jour de leurs logiciels. Les outils nécessaires pour relever des défis complexes peuvent créer des silos de données involontaires

Gestion proactive des données

À mesure que le volume et la vitesse des données augmentent et que les entreprises effectuent des transactions, elles réalisent que le travail sur les données est constant. Cependant, elles peuvent intégrer de bonnes pratiques dès le départ, afin de simplifier la location de données ou la fusion avec une autre entreprise. Ces mesures initiales impliquent notamment de favoriser la discipline en matière de données, d’être conscient des risques inhérents à l’ajout de nouveaux systèmes, l’identification des projets les plus pertinents, la mise en place d’un processus pour rassembler les données dans un catalogue, l’utilisation d’outils de gouvernance ou encore la labélisation datas trust.

Comme toute matière précieuse, la donnée doit en parallèle, être protégée à tous les niveaux de traitements contre le vol ou la corruption.