Big Data : comparatif des offres Hadoop en mode cloud John Salch (Pros) : "Le 'As a service', une réponse face à la complexité du Big Data"

 

Avis d'expert de John Salch, vice-président Technologie et Plateformes chez Pros

 

Les entreprises qui ont à gérer des volumes de données chiffrables en pétaoctets doivent aujourd'hui prendre en considération Hadoop dans leurs investissements pour accroitre les capacités de leurs datawarehouse existants. Or l'environnement Hadoop demande d'avoir des connaissances spécifiques et très peu de DSI disposent actuellement de suffisamment d'expérience sur Hadoop pour se lancer.

john salch est vice-président technologie et plateformes chez pros.
John Salch est vice-président Technologie et Plateformes chez Pros. © Pros

Si Hadoop peut fonctionner sur du matériel banalisé, le coût final doit être pondéré par des frais de prestation de service élevés inhérents à son fonctionnement. En outre, Hadoop est un agrégat d'une myriade de logiciels libres. Pour faire fonctionner Hadoop, les entreprises devront gérer l'ensemble de ces couches logicielles. Ceci n'est pas aisé : avoir un cluster Hadoop utilisable demandera une phase de mise en place importante.

Une fois que le cluster est prêt à fonctionner, l'utiliser demandera des compétences de programmation MapReduce, ainsi que des technologies d'intégration de données. Ce que la plupart des services IT n'ont pas. On retrouve ces compétences dans les start-up et chez les éditeurs. Choisir Hadoop sous la forme "As a Service" permet de contourner tous ces obstacles.

Amazon est le plus mature sur le marché, mais...

Les tarifs avancés n'entrent pas en ligne de compte. Le prix de l'infrastructure est en variation constante. Et les trois prestataires s'accordent dans ces variations de prix. Amazon a dans son écosystème la plus large combinaison de composants de base. Elle est la société la plus mature dans le domaine. Cependant, Amazon ne s'est concentré sur l'entreprise que très récemment. Celles qui ont déjà investi dans son écosystème, pourraient trouver des avantages à Amazon EMR.

Google est le dernier arrivé sur la scène de l'infrastructure cloud. Il semble plutôt cibler la communauté des développeurs et des éditeurs plutôt que les entreprises. Mais comme pour Amazon, les entreprises déjà équipées par Google pourraient être intéressées par sa plateforme Hadoop.

Microsoft est dans le cloud depuis un certain temps, mais pas depuis aussi longtemps qu'Amazon. En revanche, Microsoft a de très bonnes connaissances du monde des développeurs et de l'entreprise.

L'infrastructure cloud de Microsoft s'apparente à celle d'Amazon, même si elle offre moins d'options. HDInsight sera parfait pour les sociétés déjà équipées en technologies Microsoft. Le plus intéressant chez Microsoft c'est son offre récente de plateforme as a service Azure Machine Learning. Celle-ci utilise Hadoop pour réaliser des expériences scientifiques sur la donnée. Armée de logiciels natifs de programmation, la solution peut être utilisée sans l'IT. J'aime cette approche : offrir aux entreprises la puissance d'Hadoop sans en imposer les exigences en termes de formation.

Big Data / Hadoop