Le calcul met le cap sur le Cloud Computing Hadoop : une solution de Cloud de calcul Open Source

Lorsque l'on évoque le calcul en mode Cloud avec les spécialistes du domaine, un acteur est très vite évoqué dans la conversation : Cloudera. Lancée en 2008, cette société commercialise une solution Open Source conçue pour bâtir des plates-formes de Cloud privées ou publiques adaptées aux applications de calcul. Elle repose sur le framework Java Apache Hadoop. Cloudera a levé 36 millions de dollars au total. Depuis quelques mois, elle multiplie les partenariats. Il faut dire que l'infrastructure Hadoop est le fruit d'un développement commun de plusieurs géants sur Web, au premier rang desquels Yahoo!, Facebook et Google. Tous l'exploitent sur leur propre serveur - notamment pour réaliser des traitements de logs.    

 

Optimiser l'exécution des calculs sur architectures massivement distribuées  

fabrice bonan est cofondateur de talend et directeur des opérations de la
Fabrice Bonan est cofondateur de Talend et directeur des opérations de la société. © Talend
Plusieurs ténors du traitement de données ont ainsi annoncé des accords avec Cloudera, en vue d'intégrer leur offre à l'infrastructure Hadoop. C'est le cas de l'éditeur de solutions de gestion de données Informatica, mais également du spécialiste de l'entrepôt de données Terradata. Dernier partenariat en date : celui signé avec le français Talend, éditeur de solutions Open Source d'intégration de données, de gestion de la qualité des données et de MDM (gestion des données de référence). Comme Informatica et Terradata, Talend recherchait une technologie pour optimiser l'exécution de ses solutions sur architectures de serveurs internes massivement distribués

"Grâce à Hadoop, notre interface Talend Open Studio permet de concevoir des flux de traitement pour un nombre beaucoup plus important de nœuds", commente Fabrice Bonan, cofondateur de Talend et directeur des opérations de la société. Principal avantage : une architecture composée de nombreux petits serveurs, au lieu de machines plus fortes et puissantes, qui est plus facilement adaptable en vue de répondre à l'évolution des besoins de traitement. Plusieurs clients de Talend utilisent déjà la technologie de l'éditeur en lien avec Hadoop, AOL et e-Bay notamment. "Le groupe financier Citigroup est en phase de réflexion", confie Fabrice Bonan.  

IBM adosse son Cloud de calcul à Hadoop


L'un des principaux concurrents de Cloudera n'est autre qu'IBM. Le géant a dévoilé en mai 2010 une offre d'analyse de données, basée elle aussi sur Hadoop, fonctionnant sur son environnement de Cloud public. "L'installation de ce logiciel dans notre Cloud permet à une entreprise d'aborder plus facilement l'analyse intensive de données et de déterminer comment exploiter au mieux des volumes importants d'informations avant de procéder au déploiement réel en interne pour des activités portant sur des données sensibles", explique le groupe, en précisant avoir lancé une version bêta de son logiciel adaptée à un déploiement en interne chez ses clients.