Le Big Data, du centre de coûts au centre de profits

Au cours des cinq dernières années, la notion de Big Data a profondément évolué, passant du stade où son existence même échappait aux directeurs des systèmes d’information à une ère où plus aucun PDG ne conçoit de ne pas y consacrer une stratégie à part entière.

Aujourd'hui, nous savons ce que recouvre le concept de Big Data, comment en tirer le meilleur parti et comment il transforme tous les aspects de notre quotidien, de la manière dont nous travaillons à notre mode de vie, en passant par la façon dont nous jouons. Cependant, un certain flou persiste encore autour du coût de mise en place d’une stratégie de Big Data pour l’entreprise, mais aussi sur les méthodes à utiliser pour doter le personnel des compétences nécessaires pour le maîtriser. Toutefois il est important de veiller à ce que les salariés restent concentrés sur les activités journalières nécessaires au bon fonctionnement de l’entreprise.

Les stratégies de Big Data les plus modernes s’appuient en règle générale sur l’adoption de technologies open source de pointe comme Apache Spark, Kafka, Cassandra ou encore Mesos. Ce type d’outils permet aux équipes de développeurs de concevoir des applications distribuées modulables, capables d’intégrer des données à une vitesse jamais atteinte, de les traiter et les analyser à la volée et de passer du traitement par lot caractéristique des premiers outils du Big Data à une capacité de traitement en temps réel ou quasiment. À une époque qui voit ces technologies évoluer rapidement et de nouvelles apparaître à intervalles réguliers, les DSI éprouvent de plus en plus de difficultés à dénicher des salariés capables de manier ces outils, ce d’autant que ceux-ci ne sont pas légion et sont souvent ardemment courtisés par les start-up les plus en vogue.

Faute de débloquer des ressources pour renforcer les effectifs, la DSI de l’entreprise ne pourra faire évoluer le Big Data d’un centre de coûts à un centre de profits. Ces compétences ne seront pas suffisamment généralisées pour cesser de faire l’objet de la surfacturation qui prévaut aujourd’hui (voir l’enquête de Stack Overflow ici). Qui plus est, selon une enquête réalisée dernièrement par DataStax auprès de plus de 250 développeurs, ingénieurs et architectes, seuls 8 % des répondants estiment que le vivier actuel de techniciens formés à NoSQL est suffisamment étoffé pour satisfaire la demande dans le secteur des systèmes de gestion de bases de données.

Les technologies open source les plus populaires reçoivent le soutien des grandes entreprises pour fournir des supports pédagogiques, de l’assistance, des logiciels et des services. Il faut dire que les entreprises risqueraient gros à miser sur des technologies qui ne s’accompagneraient pas d’une forme de service après-vente. Vers qui se tourneraient-elles si la situation virait à la catastrophe ? De fait, les éditeurs ont la même ambition que tout directeur informatique : faire en sorte que le plus grand nombre maîtrise leur système, de sorte que son adoption ne soit plus freinée par quelque réticence que ce soit.

Toutefois, la plupart des start-up commercialisant des solutions open source sont tributaires des recettes issues de la formation pour poursuivre leur croissance. Or, en facturant ces formations, elles instaurent un obstacle financier qui limite le nombre de personnes disposées à payer pour apprendre à maîtriser la technologie. Les sociétés open source, vont un peu plus loin et proposent des formations en ligne gratuites afin de répondre à la nécessité de développer et d’élargir le vivier de professionnels capables de manier des technologies comme NoSQL et Cassandra. Bien qu’étant encore en phase embryonnaire, ces initiatives vont peu à peu contribuer à la démocratisation des compétences en Big Data et permettre aux DSI de former leur personnel pour un coût bien plus raisonnable. Ainsi, la pénurie de compétences sur le marché ne devrait plus être un obstacle financier à l’adoption des technologies du Big Data.