De data lake à plateforme d'application, la métamorphose de Microsoft Fabric

De data lake à plateforme d'application, la métamorphose de Microsoft Fabric Le lac de données multicloud se transforme en un véritable environnement applicatif. Le point sur cette vaste mutation.

Historiquement, la plateforme Fabric se présente sous la forme d'un data lake multicloud. Intégrée au cloud Azure de Microsoft, cette solution cible l'ensemble des métiers de la data, du data engineer au data analyst en passant par le data scientist. Dans ses dernières itérations, l'environnement évolue pour se transformer en une plateforme d'application.

Pour venir se nicher dans les applicatifs, Fabric étend les formats de données qu'il supporte. Historiquement, l'édifice prend en charge les données Parquets et surtout Delta Lake, un format de données open source promu par la data platform Databricks et porté par la fondation Apache. A cette première couche s'ajoute désormais Iceberg, la sémantique de données utilisée par Snowflake, principal concurrent de Databricks.

"On vient ainsi casser les silos d'informations et les expérience analytics qui viennent par-dessus pour aligner l'ensemble de l'expérience utilisateur depuis un même environnement", se félicite Xavier Perret, directeur du cloud Azure au sein de Microsoft France.

Vers la gestion temps réel

Fabric recouvre les données transactionnelles et statiques. Mais ce produit se devait d'intégrer le temps réel pour pouvoir servir les applications de manière dynamique. C'est désormais chose faite avec l'intégration d'un moteur baptisé Real-Time Intelligence. "Il permettra par exemple de créer des tableaux de bord mis à jour au fil de l'eau en streamant l'information", illustre Xavier Perret.

"Copilot permet à un data analyst d'interroger en mode conversationnel toutes les sources données disponibles via Fabric"

Autre évolution de Fabric : l'intégration de Microsoft Copilot. "Grâce à cet assistant, un data analyst pourra interroger en mode conversationnel toutes les sources de données disponibles via Fabric sans avoir à saisir une seule ligne de code", vante Xavier Perret. Les questions posées par l'utilisateur sont traduites à la volée dans le langage de requêtage KQL (pour Kusto Query Language) supporté par Fabric. "Cette approche permet également d'apprendre à utiliser KQL en visualisant comment une requête KQL se rapporte à la question initiale", ajoute-t-on chez Microsoft.

Dans sa mise à jour de juin 2024, Fabric introduit la possibilité d'exécuter des requêtes KQL directement au sein de tableaux de bord mis à jour en temps réel. Cette fonctionnalité rationalise le processus d'analyse d'informations en transformant rapidement les données brutes en informations exploitables. "En épinglant les résultats des requêtes, vous pouvez facilement créer et partager des tableaux de bord avec votre équipe, et améliorer ainsi la collaboration et la prise de décision", précise-t-on chez Microsoft.

Un connecteur Spark pour l'entrepôt de données Fabric est en outre lancé. Il permet par exemple à partir d'une table ou d'une vue dans un dataframe Spark de créer une table dans un lakehouse Fabric. A l'inverse, les expérience d'ingénierie de données et de data science de Microsoft Fabric sont prises en charge par la plateforme de calcul distribuée d'Apache. Le tout est là-encore mis au profit des applications temps réel et des workload d'intelligence artificielle (par le biais de SparkML).

La création d'API à la volée

Enfin, la solution de Microsoft offre désormais la possibilité de créer des API GraphQL. Des interfaces d'application qui fonctionneront sur l'ensemble des données Fabric, en renvoyant des informations en provenance de toutes les sources sous-jacentes au sein d'un seul objet JSON. Une petite performance dans le monde du multicloud.

En conclusion, ces mises à jour de Microsoft Fabric comblent de nombreuses lacunes évidentes de la plateforme. En facilitant le travail avec des formats de données alternatifs, y compris les données en temps réel, et en offrant un support pour les API GraphQL, Microsoft Fabric démontre comment une plateforme peut permettre de passer des données brutes aux applications analytiques, quel que soit le niveau de compétence. La notion d'application platform se dessine bel et bien clairement.