Panorama des solutions de big data Big Data : des solutions majoritairement open source

Les grands acteurs du web tels que Google, Yahoo ou Facebook ont été les premiers à être confrontés à des volumétries de données extrêmement importantes, et les principales innovations se retrouvent sans surprise parmi ces pionniers. Les développements portent essentiellement sur deux types de technologies :

 les bases de données ;

 les plates-formes de développement et de traitement des données.

Ces entreprises innovantes ont choisi pour la plupart d'ouvrir le code initialement développé en interne pour en faire des projets open source. Le tableau 4.3 présente quelques exemples de technologies open source utilisées pour la gestion des données massives et dont l'origine est un développement interne :

tableau 4.3. quelques technologies open source du big data.
Tableau 4.3. Quelques technologies open source du big data. © Lavoisier


Un certain nombre des technologies citées précédemment comme Hadoop et Cassandra font partie de la fondation Apache, organisation à but non lucratif qui développe des logiciels open source, dont le célèbre serveurApache HTTP Server. Les objectifs principaux de la fondation sont deprotéger juridiquement le travail des contributeurs et d'empêcher que la marque Apache soit utilisée illégalement.

Il est intéressant de souligner que les grands acteurs du logiciel ont complètement intégré la dimension open source, en proposant dans leurs offres dédiées au big data des briques basées sur ces technologies. Ainsi, Oracle a mis Hadoop au cœur de son offre "Big Data Appliance",Microsoft a également intégré Hadoop au sein de son offre Windows Azure,de même que IBM, EMC et Netapp pour leurs offres de gestion de données volumineuses. Parmi les différentes technologies développées, Hadoop apparaît clairement comme une solution de référence.

Ces bonnes feuilles sont extraites de l'ouvrage "Enjeux et usages du Big Data" (Collection Management et informatique), de C. Brasseur, chez ©Lavoisier, 2013.

Big Data / Hadoop