Vade-mecum du Big Data en 2013
Big Data. Au-delà des discours marketing, des positionnements et des rêves du début, de plus en plus d’entreprises savent maintenant qu’elles doivent d’une manière ou d’une autre passer à l’action.
En 2013, les idées clés autour du Big Data se
clarifient et s’organisent. Les tous premiers retours d’expérience de projets réels
se dévoilent et viennent enrichir la connaissance du sujet.
Leurs motivations sont connues
Alors que les données sont vues comme « un nouvel or noir », le Big Data s’impose logiquement comme un levier de croissance. Nous assistons de manière générale à la prise de conscience récente de l’importance des méthodes statistiques dans l’analyse des données. Un sujet qui était porté jusqu’à présent avec pugnacité seulement par les connaisseurs des techniques de Data Mining. L’effet Big Data leur donne raison. Mais pour une entreprise qui veut mener un tel projet, les questions restent souvent nombreuses :
Que va m’apporter le Big Data concrètement ?
L’exploitation intelligente de l’océan de données est
l’occasion de mettre en application réelle un discours très présent depuis
quelques années et toutes ses déclinaisons : « mettre le client au centre de l’entreprise ». Big Data, Data Mining
et analyse de données se positionnent aisément comme des accélérateurs autour
de ces enjeux, plus difficiles qu’ils n’y paraissent. Mieux, la capacité de
prédiction qu’ils confèrent permet d’agir pour éviter la perte de clients, de
façon réactive comme proactive, et de mieux gérer son cycle de vie. Nous
touchons là au cœur des enjeux d’entreprise : mieux comprendre le parcours
client et améliorer son expérience. Ce point n’est encore que rarement mis en
avant quand on parle de Big Data… mais très prochainement ce sujet va devenir
central. En 2013, sans Data Mining, pas de connaissance client. Et sans
connaissance client, pas d’amélioration de l’expérience client.
Enfin, le Big Data permet d’anticiper les évolutions ultra-rapides du marché. Ces
dernières années ont vu des clientèles se détourner très vite de certaines
entreprises au profit de leurs concurrentes ou pour des produits de
substitution. Tout le monde ne peut pas engager des analystes pour faire la
veille de tout ce qui se passe sur son secteur. Le Big Data offre la
possibilité d’observer ses propres chiffres et de mener l’enquête pour la
moindre irrégularité. Du général au particulier, le Big Data permet de cibler.
Quel doit être mon point de départ ?
La priorité, c’est d’abandonner immédiatement l’idée qu’il suffit de récolter énormément de données et de les mettre dans un datawarehouse pour ensuite espérer faire du Big Data avec un « outil magique ». C’est malheureusement un discours que l’on entend beaucoup, y compris chez certains professionnels. Si l’on comprend bien que la donnée brute est bien la matière de base du dataminer au même titre que le parpaing ou la brique dans le BTP, personne n’imagine qu’il suffit de jeter dix tonnes de mortier et de parpaings dans un terrain vague pour voir soudain pousser un immeuble ! Pour le Big Data, la logique est identique : mettre toutes ses données dans un entrepôt n’a jamais fait un modèle d’analyse pertinent, qui va, lui, apporter de la valeur à l’entreprise.
De quoi ai-je besoin pour m’attaquer au Big Data ?
Il faut avant tout avoir un objectif ! L’entreprise doit savoir ce qu’elle veut faire. Elle a besoin d’avoir des données à sa portée qui vont dans ce sens. Se dire « le Big Data va faire du bien à mon business », ce n’est pas suffisant ! Au-delà de ce prérequis, elle a également besoin de compétences adéquates, internes ou externes. Il lui faut les bonnes compétences, le bon architecte, les bons coordinateurs, capables de parler à plusieurs métiers. Or, à l’heure actuelle, nous faisons face à une pénurie de data scientists. Ce métier relativement neuf nécessite une triple compétence : la statistique, l’informatique et la compréhension du métier concerné par les analyses de données (par exemple, le marketing).
De façon plus pratique, le point de départ est d’attaquer ce projet comme tous les autres : ce n’est pas parce que le Big Data est un sujet à la mode, qu’il ne faut pas être extrêmement rigoureux et vigilant sur la gestion de projet. Cette rigueur est d’autant plus vitale que l’océan de données n’est pas fondamentalement propice à un traitement statistique. C’est la qualité et la richesse des données auxquelles l’entreprise accède qui posent question. Si elles ne sont pas au rendez-vous, le fait d’avoir de grands volumes de données ne changera rien et l’entreprise n’en tirera aucune valeur réelle.
Quels caractéristiques doit avoir un outil d’analyse du Big Data ?
Outre sa capacité à traiter de grands volumes de
données rapidement, il est très important que l’outil soit accessible aux
« métiers ». Face à la
nouveauté du sujet et à la pénurie de spécialistes formés expressément, les
aspects pédagogiques et l’intuitivité sont donc à privilégier.
Par ailleurs, il n’y a pas de « boite noire » capable de s’emparer du
Big Data d’un côté et d’en ressortir des pépites d’or de l’autre. Un outil doit
donc être suffisamment complet et ouvert pour permettre l’application de modèles
d’analyses adaptés. La voie la plus sure est de pouvoir accéder à des données de
qualité, qui permettront d’appliquer des algorithmes statistiques : la robustesse,
la précision et la fiabilité d’un modèle conçu sur cette base sera très bonne.
Pour autant, dans un environnement Big Data, l’outil doit également être
capable de traiter des données de moindre qualité, qui ne manqueront pas d’être
présentes, à l’aide notamment d’algorithmes moins exigeants, comme le Support
Vecteur Machine (SVM), les réseaux bayésiens, ou les réseaux de neurones.
Comment convaincre le management ?
Les premiers retours d’expériences sont encore frais, ce qui rend difficile de chiffrer avec exactitude le ROI d’un projet Big Data. Le meilleur argument reste que pour une entreprise qui ne prend pas le sujet à bras le corps et qui ne s’habitue pas à cette complexité… il sera sans doute trop tard quand elle se rendra compte de la nécessité que cela représentait. C’est ce que l’histoire nous montre avec le virage Internet et l’expérience malheureuse de nombreuses sociétés VPCistes. Nous sommes sur des questions propres aux projets à long terme, gros enjeux et gros investissements, qui changent en profondeur l’entreprise. Prendre du retard maintenant, c’est risquer la catastrophe à l’arrivée.
Un dernier conseil ?
Il vaut mieux commencer dès maintenant un projet Big
Data modeste de façon rigoureuse… que de se lancer dans l’urgence plus tard sur
un projet tellement ambitieux qu’il ne sera jamais achevé. Il faut avoir
conscience que les implications d’un tel projet vont toucher la DSI mais aussi
l’organisation du commerce, le marketing, le département des ressources
humaines, jusqu’à la direction générale !
Il y aura des ramifications
inattendues. Dans ce cadre, il est
primordial que le management s’implique dès le départ. Une direction qui se
contente de donner le feu vert n’en fait pas assez : il lui faut porter un
engagement en moyens et en ressources, demander une évaluation des compétences
disponibles. C’est à ce titre qu’il sera possible de rendre intelligible et de redescendre
la connaissance obtenue jusqu’au niveau opérationnel. Sans ce travail de fond, l’entreprise
ne profitera d’aucune valeur.