Big Data : comparatif des offres Hadoop en mode cloud Microsoft Azure HDInsight : Hadoop mis à la portée d'Excel

L'offre Hadoop hébergée par Microsoft, baptisée HDInsight, est officiellement venue rejoindre l'offre de cloud Microsoft Azure en 2012. Celle-ci s'appuie sur Apache Hadoop et Yarn, et intègre de multiples composants de la plateforme Hortonworks Data Platform.

Plusieurs versions sont disponibles et, outre le moteur MapReduce Hadoop / Yarn, l'essentiel des briques Apache répondent à l'appel dans l'offre Microsoft, dont la base NoSQL HBase. Dernièrement l'éditeur annonçait l'arrivée d'Apache Storm pour l'intégration de données en temps réel, une solution qui vient de chez Twitter.

HDInsight s'intègre aux outils de reporting de Microsoft

excel peut accéder au moteur hadoop d'azure.
Excel peut accéder au moteur Hadoop d'Azure. © Capture / JDN

Parmi les atouts différenciateurs de l'offre HDInsight, figure son intégration aux solutions Microsoft. On peut stocker des données sur un service HDFS (pour Hadoop Distributed File System), sur Apache Sqoop mais aussi sur Azure blob, SQL Service Integration service et sur Microsoft Analytics Platform. L'accès au cluster HDInsight est possible directement via Visual Studio et son SDK pour Microsoft Azure. En outre, le Data Scientist va pouvoir gérer ses clusters HDInsight via PowerShell ou via l'API .NET.

Un point fort de cet Hadoop hébergé par Microsoft est son intégration aux outils décisionnels de l'éditeur. SQL Server Analysis Services, SQL Server Reporting Services mais aussi Excel peuvent accéder au moteur HDInsight. Potentiellement, un utilisateur métier peut ainsi lancer une analyse sur un cluster Hadoop dans le cloud de Microsoft depuis sa feuille Excel, via les Power Query.