
-
Xavier Biseul
- JDN
Derniers articles de Xavier Biseul
-
Data lineage : définition, principes et outils
En procédant à un inventaire des données, le data lineage assure leur traçabilité. Ce travail de cartographie des flux de données repose un ensemble de techniques. Quelques explications et exemples d'outils.
-
3V en big data : définition et approche
Le big data consister à stocker, traiter et valoriser un nombre de toujours plus important de données que les méthodes traditionnelles n'arrivent plus à gérer. Selon le cabinet d'études Gartner, cette approche se définit par la règle des trois V.
-
Amazon Redshift : le data warehouse en mode cloud d'AWS
-
Analyse descriptive, qu'est-ce que c'est ?
Par définition, l'analyse descriptive vise à évaluer les données statistiques passés pour mieux anticiper les tendances à venir. On distingue l'analyse univariée de l'analyse bivariée.
-
Analyse prédictive : définition, méthodes statistiques, exemple
Par définition, l'analyse prédictive des données prédit le futur en se basant sur les informations du présent et du passé. Elle regroupe un ensemble de méthodes statistiques et technologies de machine learning.
-
Analyse prescriptive : définition
Dédiée à la prise de décision, l'analyse prescriptive oriente une organisation dans ses choix business et le déploiement d'actions stratégiques. Son développement est étroitement lié à celui du big data.
-
Azure Synapse : la data platform de Microsoft
Azure Synapse Analytics est un service de data warehouse dans le cloud, prenant en charge SQL et Apache Spark. Dédié à l'analytics, au big data et au machine learning, il assure l'intégration, la préparation et la transformation des données.
-
Data catalog : définition, exemple, outils..
Un data catalog, ou catalogue de données, renvoie par définition à un inventaire des données d'une organisation. Il fait intervenir différents outils de préparation et d'indexation d'information.
-
Cassandra : maîtriser la base NoSQL orientée colonnes
-
Data gouvernance : comment déployer une gouvernance des données ?
Par définition, la data gouvernance réunit l'ensemble des règles et des processus gérant, par exemple, le cycle de vie de la donnée. Elle repose sur un framework, différents outils voire une plateforme dédiée.