Sans les bons outils, le Big data n’est rien d’autre qu’une dépense sans intérêt

Les projets Big Data explosent dans les entreprises, et pourtant, un grand nombre d’entre eux échouent dès les premiers mois. En cause, le plus souvent, des problématiques mal appréhendées et des infrastructures non adaptées.

L’investissement dans une infrastructure Big Data ne va pas de soi. Voici quelques points à garder en tête au moment de franchir le pas entre une base de données vétuste et une plateforme Big Data moderne.

Déterminer les usages. Actuellement, beaucoup de projets Big Data échouent parce qu’ils sont pensés uniquement d’un point de vue technique et pas suffisamment autour des usages finaux. La première étape consiste donc à se concentrer également sur la valeur métier qu’ils doivent dégager, qu’il s’agisse de vouloir améliorer la connaissance du consommateur en analysant son parcours en ligne, analyser les performances de son site web ou encore créer un data lake pour traiter les données non structurées.

Pour débuter, l’utilisation d’une plateforme gratuite peut s’avérer particulièrement judicieuse. Plusieurs plateformes très complètes s’appuyant sur des technologies open source telles que HBase ou encore Spark sont aujourd’hui disponibles sur le marché et répondent parfaitement à des exigences de temps réel et d’interopérabilité. Elles représentent ainsi une très bonne alternative pour réaliser ses premiers pas à moindre risque, sans avoir à dépenser des centaines de milliers d’euros.

Après avoir exploité cette plateforme sur un premier projet, l’utilisation d’une plateforme payante peut constituer la prochaine étape en vue d’investir dans un déploiement plus important pour accompagner la croissance de l’activité, tout en prenant en considération d’autres besoins techniques comme la sécurité, la haute disponibilité ainsi que le déploiement multi-datacenters.

Se familiariser avec l’écosystème. L’univers Big Data peut être décourageant pour les nouveaux venus mais l’architecture environnante de votre plateforme peut nettement faire la différence en termes d’efficacité pour l’entreprise. En plus d’une distribution Big Data, Hadoop est intégré avec un certain nombre d’outils pour faciliter la gestion, l’interprétation et l’exploitation des données. Parmi ceux-ci, Apache Drill pour l’interrogation de vastes ensembles de données, Apache Hive pour les requêtes ad hoc et l’agrégation des données ou encore Cascading en tant que framework Java pour la construction de modèles d’apprentissage automatique et d’autres applications de traitement de données.

Pour gérer cette suite d’outils avec un maximum d’efficacité, il convient de rechercher un prestataire qui intègre ces différentes solutions et permet de les expérimenter et tester facilement. Il ne faut pas hésiter à se renseigner sur les formations ou le support disponibles pour pouvoir tirer le meilleur parti de ces types d’outils.

Identifier les parties prenantes. A mesure que les données gagnent en importance pour l’entreprise, il devient nécessaire d’investir dans la plateforme et l’infrastructure. Fort heureusement, le matériel est devenu un bien de consommation courante et, par conséquent, n’a jamais été aussi abordable. Les nombreux services cloud constituent eux aussi une solution pour ceux qui n’ont pas besoin ou envie d’investir dans l’acquisition de leur propre matériel. Cela ne veut pas dire pour autant que ce composant ne représente pas un investissement significatif.

Il est nécessaire de déterminer les différentes parties prenantes et leurs motivations lorsqu’il s’agit de « vendre » cet investissement en interne. Il s’agit de convaincre la direction financière que l’adoption d’une plateforme Big Data va effectivement augmenter le chiffre d’affaires et dégager un fort retour sur investissement, et ce de manière rapide et durable. Un travail en étroite collaboration avec la direction générale est judicieux puisqu’il permet d’établir des statistiques illustrant en quoi cet investissement permettra à l’entreprise de se démarquer de ses concurrents sur le long terme.

Investir dans le personnel. Les données ne seront d’aucune utilité si personne n’est là pour les comprendre et les interpréter, puis s’en servir afin d’optimiser les investissements. Cela peut constituer l’une des principales difficultés dans l’élaboration d’une stratégie Big Data, car les candidats présentant les compétences requises ne sont pas légion. Le profil idéal doit connaître le marché où opère l’entreprise et posséder une expertise des plateformes Big Data, de façon à mettre sa maîtrise du marché au service de la résolution des problèmes posés par la croissance de l’entreprise.

Faute de candidats réunissant les deux compétences, engager une personne justifiant uniquement d’une expérience des plateformes Big Data peut être judicieux également, à condition de mettre l’accent sur sa formation aux tenants et aboutissants de votre marché. Cette compréhension concrète des problèmes auxquels l’entreprise est confrontée apportera l’assurance de structurer la plateforme de façon à ce qu’elle génère un maximum de valeur pour l’entreprise.

Investir dans les données n’est plus une option. Les acteurs qui sauront faire les meilleurs choix d’infrastructure et de stratégie pour une exploitation efficace des données, seront donc les plus susceptibles de conserver un avantage concurrentiel sur leur marché.

Big Data