Comparatif : 4 offres de Big Data dans le cloud Azure HDInsight, l'intégration à l'écosystème Microsoft

Marchant sur les traces d'AWS, Azure a lancé, en 2012, un PaaS Hadoop reposant sur son service de stockage objet Blob Storage. Baptisé Azure HDInsight, il intègre progressivement les outils de la galaxie Hadoop que ce soit pour les traitements en mode batch (MapReduce) et temps réel (Storm), l'exécution des applications d'analyse de données (Spark) ou encore la gestion d'une base NoSQL en colonnes (HBase). Les environnements Pig (script), Hive (SQL) sont également au programme. HDInsight peut utiliser R Server pour la modélisation prédictive et l'apprentissage automatique. Pour autant, la couverture fonctionnelle n'est pas aussi complète que celle d'Amazon EMR.

Une intégration native avec Excel et Power BI

La spécificité d'Azure HDInsight se situe dans son intégration à l'écosystème Microsoft. La plateforme prend en compte le langage .Net aux côtés de C# et Java, les machines virtuelles tournent indifféremment sous Linux ou Windows. Le point le plus important étant l'intégration en mode natif des outils décisionnels de l'éditeur, que sont Excel et Power BI. Dans cette optique, ses concurrents ont, eux, dû nouer des partenariats avec des fournisseurs tiers et développer des drivers ODBC.

Enfin, HDInsight permet le déplacement de données Hadoop d'un cluster local vers le cloud Azure à des fins de sauvegarde, de développement, de test ou de débordement de charge (pour peu de mettre en œuvre la même distribution Hortonworks).

Microsoft Azure HDInsight en bref

Points forts

Points faibles

- L'intégration native de Power BI et Excel

- La facturation à la minute

- La couverture fonctionnelle Hadoop plus limitée qu'AWS

- La complexité tarifaire