Comparatif : quatre distributions Hadoop au crible Hortonworks data Platform : une distribution 100% open source

Hortonworks est une spin-off créée par Yahoo! et Benchmark Capital en 2011. Elle emploie de nombreux contributeurs du projet original Apache Hadoop qui constitue le cœur de son offre. C'est donc la solution à privilégier si l'on veut à la fois bénéficier d'un support d'entreprise tout en bénéficiant d'une technologie 100% open source. Comparé aux offres concurrentes, c'est donc la pile qui reste la plus fidèle aux composants Apache.

En France, Hortonworks est représenté par Altic

Logiquement, on retrouve toutes les principales briques Apache dans la pile logicielle proposée par Hortonworks. HDFS et YARN constituent bien évidemment le socle de l'architecture proposée. On retrouve des composants présents sur toutes les distributions Hadoop, dont Hive, HBase, Accumulo, Solr ou encore la solution d'analyse de données Pig. Pour le volet requêtage in-memory, les ingénieurs d'Hortonworks ont privilégié Spark à Impala. A noter la solution Ambari qui a été développée en partenariat avec Pivotal. C'est cette brique Apache qui assure le volet provisioning et gestion des clusters de calcul. Si la distribution Hortonworks est jeune sur le marché, elle fait preuve d'une grande stabilité.

Hortonworks dispose par ailleurs d'une équipe commerciale et technique en France.

capture d'écran de la console d'hortonworks data platform.
Capture d'écran de la console d'Hortonworks data Platform. © Capture / Hortonworks