Big Data : le framework Spring branché sur Hadoop

VMWare enrichit la couche d'accès aux données de son framework Java. Spring Hadoop est conçu pour tirer parti de l'infrastructure de traitement massif de données distribuées.

VMWare combine l'infrastructure de développement Java Spring avec le framework Hadoop de la fondation Apache conçu pour les traitements massifs de données réparties (Big Data).

Baptisée Spring Hadoop, cette solution qui vient enrichir la couche Spring d'accès aux données (Spring Data) s'articule autour d'une extension de Spring Batch. Objectif : gérer des traitements par lot vers Hadoop. Elle simplifie également la lecture et l'écriture au sein du système de fichiers distribué d'Hadoop : Hadoop Distributed File System (HDFS). Des opérations qui pourront être gérées avec les langages de script Java (Groovy, JRuby, Jython...).

"Via le conteneur Spring, il est possible grâce à Spring Hadoop de créer des traitements via MapReduce, Streaming, Hive, Pig, et Cascading", ajoute VMWare. La configuration déclarative de HBase est également prise en charge. Enfin, Spring Data Hadoop comprend des mécanismes facilitant la création de modèles pour les connexions client à Hadoop, et supporte la boîte à outils Hadoop Tools (notamment FsShell et DistCP).

Big Data : le framework Spring branché sur Hadoop

Guides

Repères