Afin
de fiabiliser leurs données critiques, les entreprises peuvent notamment
faire appel à des solutions spécialisées de gestion de la
qualité des données. Tour d'horizon des principales offres disponibles.
Mises en place - mais de façon non exclusive
- dans un contexte d'entreprise éclatée géographiquement
sur plusieurs territoires et / ou faisant appel à de multiples bases
de données et progiciels de gestion intégrés hétérogènes
(PGI), les solutions de gestion de la qualité de données permettent
de vérifier, de rationaliser et d'éviter la formation de doublons
d'informations (noms, adresses postales, références clients, catalogues
produits...).
"La gestion de la qualité des données recouvre deux
problématiques complémentaires avec l'analyse des données a priori généralement
réalisée au niveau des interfaces homme-machine d'administration, et l'analyse
des données a posteriori, par exemple via des outils spécialisés
de qualité de données", note Nicolas Debaes, architecte senior au
sein d'Octo Technology, cabinet de conseil en architecture du SI. Nous avons choisi
de nous pencher aujourd'hui sur cette seconde catégorie de solutions.
Les
critères de choix | 1 | Règles
de comparaison | 2 |
Connecteurs
ETL/PGI |
3 |
Interface
graphique Web
et internationalisation des analyses |
Les solutions de gestion de la qualité de données intègrent
nativement les plus importantes règles de comparaison de données.
Parmi elles, citons notamment le profiling (capture des metadonnées),
le parsing (décomposition des champs de texte) ou encore le cleansing
(toiletage des données) et le matching (identification des liens
et fusion des entrées). Néanmoins, certaines disposent d'un module
d'array matching pour comparer des données de façon croisée
et ainsi réduire le temps de développement d'autres règles
de comparaison.
Les solutions peuvent par ailleurs se distinguer par leur
capacité à intégrer un certain nombre de référentiels externes stratégiques
(données de gestion de la relation client, marketing, forces de ventes...)
ou plus opérationnels (annuaires d'adresses postales...). Pour y
parvenir, les solutions sont dotées nativement d'un nombre plus ou moins
important de connecteurs vers des outils d'ETL (Extract Transform and Load)
tel que Microsoft Data Transformation Server ou bien Oracle Warehouse Builder
et vers des PGI du marché (SAP, Siebel, Oracle...).
"Les éditeurs
proposent de masquer la complexité de la gestion automatisée des requêtes
au travers d'une interface Web graphique créée pour en faciliter
la compréhension en vue utilisateur", indique Réda Gomery, directeur
conseil en pilotage de la performance et informatique décisionnelle chez
Micropole-Univers. Sa présence, couplée au nombre de pays pour lesquelles
les informations globales peuvent être analysées, standardisées
et corrigées, constituera notre dernier critère de choix. |