Comparatif : quatre distributions Hadoop au crible MapR : l'innovation et la richesse fonctionnelle

Avec EMC, Google, Amazon parmi ses soutiens, MapR se range parmi les poids lourds des éditeurs de distribution Hadoop. L'éditeur propose trois éditions de sa distribution. La version d'entrée de gamme, baptisée M3, est la seule version en téléchargement. M5 et M7, plus riches fonctionnellement, sont facturées par l'éditeur. 

Revers de la médaille de la richesse fonctionnelle : beaucoup de composants spécifiques

Globalement, la pile logicielle proposée par MapR se caractérise par une grande simplicité de mise en œuvre, une bonne portabilité et surtout une grande richesse fonctionnelle. Le nombre de composants supportés est impressionnant. Car outre le socle Hadoop et la brique de traitement de données YARN, l'éditeur propose les outils Hue, HttpFS, Flume, Sqooq pour le volet intégration de données. Pour le volet analyse, MapR a choisi de doter sa distribution des solutions Shark mais aussi Apache Drill, Hive et la solution in-memory Impala pour l'interrogation SQL, le moteur de recherche Solr, Accumulo et Hbase pour le volet NoSQL.

Revers de la médaille de la richesse fonctionnelle de la solution, beaucoup de composants sont assez spécifiques à l'éditeur et rendront une migration vers une autre distribution problématique. C'est la distribution la plus éloignée du projet Apache.

l'architecture de la distribution hadoop mapr.
L'architecture de la distribution Hadoop MapR. © MapR

Big Data / Hadoop