Fiche pratique

  • Data privacy : comment assurer la confidentialité des données

    La data privacy vise à assurer la confidentialité des données. Un data privacy agreement permet de formaliser les moyens mise en œuvre pour garantir le respect à la vie privée. Le data privacy officer est responsable de la bonne conformité des traitements de données personnelles.

    • Data streaming : définition, architecture et outils

      Le data streaming correspond à la diffusion de données en continu et en temps réel. Il repose sur un ensemble de technologies, de plateformes comme celles proposées, par exemple, par Kafka ou des langages tels que Python.

    • Data visualisation : définition, démarche et outils

      Par définition, la data visualisation consiste à restituer des données, parfois complexes, sous forme de représentations visuelles. Elle fait appel à des méthodes, des logiciels et des outils open source.

    • Data warehouse : comment le mettre en place ?

      Par définition, un data warehouse collecte et traite un grand volume de données à la structure définie. Cet entrepôt de données est un prérequis technique à la business intelligence.

      • Databricks : la data platform basée sur Spark

        Reposant sur l'architecture Spark et la couche de stockage open source Delta Lake, Databricks combine le meilleur du data warehouse et du data lake tout en intégrant des bibliothèques de machine learning.

      • Dataset : qu'est-ce qu'un jeu de données

        Un dataset est un jeu de données qui permet d'entraîner, valider et tester les modèles d'intelligence artificielle et tout particulièrement de machine learning.

        • Données non-structurées : comment ça marche ?

          Les données non structurées sont des données se présentant sans format prédéfini. Il s'agit notamment de fichiers images ou vidéo, de documents textes ou de PDF.

        • Données semi-structurées, qu'est-ce que c'est ?

          Les données semi-structurées ne suivent pas de format défini mais comprennent néanmoins des éléments, comme des balises ou des métadonnées, facilitant leur traitement. A l'ère du big data, XML est le standard le plus utilisé pour les exploiter.

          • Données structurées : comment ça marche ?

            Les données structurées, au format prédéfini, sont organisées dans des bases de données relationnelles et des data warehouses. Elles sont essentielles pour le référencement naturel et le SEO Google.