Penser l'avenir : intégrer l'IA dans les stratégies de Master Data Management

Le Master Data Management permet de valoriser au mieux les données d'entreprise et l'IA peut être un outil précieux dans la mise en œuvre de ces solutions

Les données d’entreprise sont-elles estimées à leur juste valeur ? Pour de nombreuses organisations, la réponse est probablement non. Selon la Harvard Business Review, « en moyenne, 47 % des enregistrements de données nouvellement créés comportent au moins une erreur critique (c’est-à-dire ayant un impact sur le fonctionnement de l’organisation) ».

C’est dans ce contexte que des approches structurées de gestion des données, comme le Master Data Management (MDM), peuvent contribuer à améliorer la qualité et la cohérence des données de référence. En favorisant une meilleure intégration et une gouvernance renforcée, ces pratiques facilitent des opérations plus fiables. Avec l'effervescence de l’intelligence artificielle (IA), la capacité des entreprises à exploiter des données précises et bien structurées devient un enjeu stratégique. Gartner souligne d’ailleurs que le MDM reste un facteur déterminant en matière de data-readiness pour l’IA.

Aujourd’hui, le Master Data Management pose trois grands défis :

  • Validation de la qualité des données : La validation traditionnelle des données repose sur des règles de gestion simples, qui peuvent ne pas tenir compte d’anomalies telles que de nouveaux formats de données ou de nouvelles sources. Lorsque les données s’écartent de ces règles, elles sont souvent ignorées, ce qui conduit à des opportunités manquées ou à des erreurs qui peuvent se répercuter à travers les différents systèmes.
  • Nettoyage et enrichissement : Ce processus améliore les règles de gestion et les API, mais manque souvent de flexibilité. Il nécessite une expertise spécifique (par exemple, configuration des expressions rationnelles) et peut entraîner des coûts élevés. Les solutions proposées par des fournisseurs tels que Dun & Bradstreet et Experian sont utiles mais ne sont pas exemptes de contraintes.
  • Matching : Le Matching repose souvent sur des règles, qui peinent à prendre en compte toutes les variations possibles des données. L’appariement probabiliste, bien qu’utile pour les données structurées, échoue souvent lorsqu’il s’agit de gérer des cas particuliers ou des ensembles de données complexes.

La bonne nouvelle ? L’IA a le potentiel de relever et de surmonter ces trois défis.

Stratégies pratiques pour intégrer l’IA dans le MDM

Pour approfondir ce sujet, voici quelques scénarios d’entreprise courants et la manière dont l’IA peut aider.

Scénario n° 1 : problèmes de qualité des données non planifiés.

Des problèmes de qualité des données peuvent survenir de manière inattendue, par exemple lorsque des idéogrammes remplacent des champs habituellement réservés à l’alphabet latin, ou lorsque le personnel de vente réutilise des colonnes pour des données non pertinentes. Ces problèmes peuvent perturber le reporting et la prise de décision.

 Solution IA : Détection des valeurs aberrantes (Outliers) - Les modèles IA peuvent analyser la structure de vos données et repérer les valeurs aberrantes qui s’écartent des modèles attendus. Ces anomalies peuvent alors être acheminées vers un examen humain ou traitées avec des règles de validation affinées, ce qui renforce en fin de compte la précision et la fiabilité.

Scénario n°2 : Les outils d’enrichissement basés sur des règles et des API sont complexes et coûteux

La mise en œuvre d’outils d’enrichissement basés sur des règles peut s’avérer fastidieuse, tandis que les services web traditionnels entraînent souvent des coûts élevés, ce qui les rend peu pratiques pour de nombreuses entreprises.

 Solution IA : Exploiter les LLM pour l’enrichissement des données - Les grands modèles de langage (LLM) peuvent simplifier l’enrichissement des données en générant des valeurs précises par le biais d’appels API. L’hébergement du LLM dans votre propre environnement cloud garantit des temps de réponse plus rapides et des performances informatiques optimisées. Grâce aux progrès significatifs récents des LLM open-source, cette approche est devenue non seulement viable, mais aussi très rentable pour les entreprises.

Scénario n° 3 : Limites des systèmes traditionnels de matching

Les systèmes traditionnels de matchings s’appuient soit sur des règles métier, soit sur des techniques probabilistes de mise en correspondance. Ces deux approches partagent une limite essentielle : la gestion de la complexité de toutes les permutations possibles des correspondances d’enregistrements est un défi écrasant. Une méthode courante consiste à créer trois ensembles de données : les correspondances, les non-concordances et un troisième ensemble de correspondances potentielles nécessitant un examen manuel. Cependant, ces vérifications manuelles demandent souvent beaucoup de travail, ce qui ralentit les processus et rend le système difficilement extensible.

 Solution IA : Exploiter l’apprentissage supervisé pour la résolution d’entités - Les modèles d’apprentissage supervisé offrent une solution transformatrice en analysant les données historiques étiquetées pour prédire les résultats des données non étiquetées. Dans le contexte de la résolution d’entités, lorsque les utilisateurs étiquettent l’ensemble de données de correspondances potentielles, ces modèles apprennent de leurs décisions. Au fil du temps, les modèles peuvent prédire avec précision les réponses humaines, réduisant, voire éliminant, la nécessité d’une intervention manuelle. Cette approche améliore considérablement l’efficacité et l’évolutivité tout en maintenant une grande précision dans les correspondances.

Tendances futures en matière d’IA et de MDM

L’IA transforme déjà rapidement le MDM, et nous n’en sommes qu’au début. À court terme, les agents IA simplifieront les outils complexes, réduisant ainsi la complexité pour les utilisateurs finaux, tandis que l’interrogation vectorielle en langage naturel rendra l’interaction avec les données plus intuitive grâce aux LLM.

Les innovations à long terme telles que le matching basée sur les LLM et la convergence du MDM, des catalogues de données et de l’IA promettent d’automatiser les processus clés, comme l’identification des sources de données de référence, la construction de pipelines et la création de « golden records » avec un minimum d’efforts manuels. En outre, investir dans des solutions MDM évolutives permettra aux organisations de s’adapter au fur et à mesure de l’évolution des technologies et de leurs besoins.

Aujourd’hui, de nombreuses solutions de MDM intègrent déjà l’IA, souvent en s’appuyant sur des modèles comme OpenAI, Claude ou LLAMA. Cependant, les entreprises doivent s’assurer que ces intégrations s’alignent sur leurs politiques de risque informatique et les objectifs à long terme. Alors que l’IA continue de transformer le MDM, les organisations qui adoptent ces avancées rationaliseront leurs opérations, amélioreront leur efficacité, réduiront la complexité et obtiendront un avantage concurrentiel puissant dans leur secteur.