Big Data : comment se lancer sans se ruiner

Big Data : comment se lancer sans se ruiner Un cluster Hadoop adossé à une compétence interne en informatique et statistiques permet de faire ses premiers pas dans le Big Data. Un budget de 100 000 euros par an est à prévoir.

Le Big Data est sur toutes les lèvres. C'est même une réalité pour de nombreuses entreprises françaises comme SFR, Pages Jaunes, Coface ou encore La Poste (lire l'article : La France met le cap sur le Big Data). Les pouvoirs publics sont également bien conscients de cet enjeux, tant en termes de perspectives d'emploi que du point de vue du rayonnement industriel qu'il est susceptible d'apporter (lire l'article : Big Data, les 5 mesures du plan de soutien dévoilées).

Mais pas question d'improviser son projet Big Data et mieux vaut tout d'abord bien en dessiner les contours sous peine de courir à l'échec. Avant de démarrer, il est ainsi crucial de déterminer si on se lance dans le Big Data dans le cadre d'une simple expérimentation ou bien à des fins de production. Mais ce n'est là que le début de la réflexion. "La pire des choses, c'est de se lancer dans un projet de Big Data et de conserver une approche organisationnelle de l'entreprise par silos. Elle ne permettra pas en effet un croisement suffisant des informations, ni de dégager une véritable valeur ajoutée", prévient Mathias Herberts, CTO de Cityzen Data, start-up spécialisée dans la capture, le stockage, l'analyse et la restitution de données.

"Un projet de Big Data un minimum sérieux se pilote en interne" (Mathias Herberts - Cityzen Data)

Une fois ce prérequis intégré, il sera impératif de ne pas sous-estimer la dimension technologique d'un tel chantier. Tout en gardant à l'esprit que les choix opérés en matière de solutions et de gestion de son projet de Big Data peuvent faire varier du tout au tout le coût global de l'opération.

"Si les entreprises abordent leur projet de Big Data avec un minimum de sérieux, elles doivent en conserver la totale maîtrise en interne, de la phase exploratoire à celle du traitement des données", conseille Mathias Herberts. "En confiant l'ensemble d'un projet de Big Data à un acteur extérieur, les entreprises se dépossèdent d'une initiative stratégique pour un coût également beaucoup plus élevé."

Reste ensuite à se doter des briques technologiques adéquates et surtout des compétences humaines qui vont avec pour en assurer la réalisation. "Il est possible de démarrer par exemple en choisissant un cluster Hadoop chez OVH avec 5 machines de 10 To dont 3 To de données utiles. Ce qui revient sur un an à 9 000 euros", explique Mathias Herberts. Un ticket d'entrée plutôt abordable à comparer aux 60 000 euros de licence et maintenance annuelles par CPU affichés par Oracle, et aux 10 à 20 000 euros par To chez Netezza.

Un coût qui peut s'envoler bien au-delà du million d'euros


Un projet de Big Data ne se résume cependant pas à un cluster Hadoop. Des briques complémentaires, open source, pourront venir s'y greffer comme par exemple Hive (datawarehouse), Pig (analyse de données), HDFS (système distribué de fichiers), Storm (analyse de flux)... Mais bien d'autres sont disponibles également (lire l'article : Panorama des solutions de big data). Surtout, un projet Big Data mené en interne nécessite des compétences humaines. Là encore, pas besoin cependant de se doter d'une armée de statisticiens pour commencer.

"Dans une optique de démarrage, on peut s'appuyer sur un informaticien pas forcément capé et doté d'une solide expérience, mais qui se montrera curieux et capable de mettre les mains dans le cambouis", indique Mathias Herberts. "On aura également beaucoup plus de facilité à faire glisser un informaticien sur des compétences de statisticien que l'inverse".

Le coût pour ce type de profil en termes de salaire moyen non chargé tournerait autour de 50 000 euros par an, ce qui fait grimper le budget annuel d'un projet Big Data de départ (comprenant par exemple un cluster Hadoop) à près de 100 000 euros. Quant aux plus gros projets, basés cette fois sur des solutions propriétaires, il n'est pas rare de les voir dépasser les 5 millions d'euros.  

Big Data / Hadoop

Annonces Google