Cinq idées fausses sur le Big Data

L’expression Big Data est probablement la plus citée actuellement dans les conversations sur l’IT, mais aussi peut-être la moins judicieusement employée. Le Big Data apparaît comme une tendance majeure ayant des effets sur quasiment tous les aspects du paysage IT actuel. Pourtant, le concept reste mal compris, et il s’accompagne d’un certain nombre de préjugés, qui influencent la perception et l’approche des entreprises de cette nouvelle tendance potentiellement révolutionnaire.

La différence est grande entre ces préjugés et la réalité et, comme c’est souvent le cas avec les grandes tendances, tant de voix s’expriment à la fois qu’il est facile de répandre des idées fausses. Je souhaite ici dénoncer cinq idées fausses concernant le Big Data, en particulier celle, pourtant quasiment universellement acceptée, selon laquelle le Big Data ne concernerait que les grandes entreprises amenées à traiter de très gros volumes de données.

  1. Big data = énormes volumes de données
L’adjectif « Big » (gros, énorme) est relatif. On évoque le plus souvent le Big Data dans le contexte des grands groupes qui génèrent des montagnes de données ; mais cette tendance à la croissance des données vaut pour les entreprises de toute taille. Et même si les volumes passent de 5 teraoctets à 10 teraoctets,  au bout du compte, ça fait toujours deux fois plus de données à gérer. La question ne porte pas sur l’importance du volume des données. Vous n’avez pas non plus à analyser toutes vos données en même temps, donc le volume total des données dans votre environnement n’est pas le critère principal. Souvent, c’est en analysant de petites quantités de données ou en les combinant avec des données externes que vous obtiendrez le résultat voulu. Toutes les entreprises sont concernées par la tendance du Big Data quelle que soit l’importance du volume de données qu’elles génèrent ou doivent traiter.  

2.  Seules les grandes entreprises sont concernées par le Big Data

PME et grands groupes ont tout autant intérêt à fonder leur stratégie sur l’analyse de leurs données. Indépendamment de la taille, nul ne se fie uniquement à son intuition.  Les plus petites entreprises auront peut-être recours moins souvent à l’analyse du Big Data (question d’opportunité ou de moyens), mais si elles doivent rectifier le tir à l’issue de l’analyse, elles le feront plus rapidement. Aussi, tandis que la tendance au « Big » Data est associée à tort aux « big » entreprises, les petites structures peuvent également adopter les meilleures pratiques décisionnelles fondées sur l’analyse des données et devancer finalement leurs concurrents, plus imposants, mais aussi moins réactifs. 

3.  L’analyse du Big Data suppose de programmer des algorithmes très sophistiqués

Certes, à l’origine, le traitement du Big Data requiert la programmation d’algorithmes compliqués par des data scientists ; mais, dans la réalité, il s’agit surtout d’adopter une approche data-driven, pilotée par les données pour mieux les comprendre et améliorer votre analyse de l’information. Grâce aux outils disponibles aujourd’hui, nul besoin de vous transformer en data scientist, ni d’en recruter un ;  des logiciels vendus dans le commerce créent les algorithmes pour vous. Et un certain nombre de ces solutions sont conçues spécifiquement pour les plus petites entreprises qui n’ont pas ces compétences en interne, ni les budgets pour engager d’énormes dépenses. Les moyens existent donc pour commencer à petite échelle, avec une relative simplicité.

4. Il faut déjà maîtriser la Business Intelligence traditionnelle avant de penser au Big Data

La BI traditionnelle consistait à produire des rapports à partir de données historiques. Mais il n’est pas indispensable de se pencher sur le passé pour comprendre le présent et envisager l’avenir. Plus que le reporting de BI du passé, statique et structuré, aujourd’hui, ce sont surtout les modèles, les logiques, les relations entre les données qui nous intéressent. C’est en identifiant des modèles que vous pourrez vous projeter, sans pour autant plonger dans le passé.  Autrement dit, pas besoin d’une solution de tableau de bord, ni d’un framework de reporting standard pour commencer à analyser vos données.

 

L’idée selon laquelle on doit maîtriser parfaitement les techniques du passé avant de pouvoir appréhender les nouvelles manières de faire crée le malentendu. C’est faux : est-ce que ma fille de trois ans doit apprendre à se servir du téléphone fixe avant d’utiliser mon smartphone ? Pas du tout ! Vous pouvez adopter l’attitude data-driven (pilotée par les données), rechercher des corrélations utiles dans vos données et identifier des modèles, sans vous former au préalable aux techniques traditionnelles de BI. Pas la peine de vous doter d’un seul datawarehouse, ni d’une solution de reporting standard  que vous interrogerez au moins une fois par mois... Regardez vos données d’un nouvel œil, tant du point de vue business qu’IT. Commencez là où le Big Data vous impose de commencer : par une question métier à laquelle vous voulez trouver une réponse.

5. La réussite d’une stratégie Big Data passe par Hadoop 

Le framework Hadoop est certes une technologie puissante, qui change pas mal de choses, mais ce n’est pas par là qu’il faut commencer.  Pour obtenir ce que l’on attend du Big Data, il faut déjà se fixer des objectifs métiers. Hadoop peut vous être utile pour obtenir des réponses, ou pas. Peut-être même que vous n’aurez besoin d’aucune nouvelle technologie. Déployer Hadoop et y charger 50 teraoctets de données ne mène à rien en soi, sans objectif métier à accomplir. Nombre de clients qui ont chargé leurs données dans Hadoop se disent : « Et maintenant ? ».  La réponse est simple : partez des objectifs métiers et non de la technologie. Il y a de fortes chances que vous trouviez par vous-même le bon itinéraire à suivre.

Certaines organisations ont fait voler en éclats ces préjugés. Dans une université américaine du Midwest, par exemple, la direction savait qu’en réduisant le taux d’abandon des études d’1 % seulement, ils pourraient accroître leur bénéfice d’1 million de dollars. Ils ont fait identifier et examiner douze variables, dont le sexe des étudiants et les cours qu’ils suivaient. Ils ont fait traiter ces données en quête de corrélations et de modèles pour identifier quels profils d’étudiants avaient un risque d’abandon supérieur aux autres. Le personnel de l’université a alors renforcé les mesures d’accompagnement et de conseil de ces étudiants avant qu’ils en arrivent au point de non-retour.  Si la direction de cet établissement avait pensé que l’analyse du Big Data n’était pas pour eux, qu’ils étaient trop petits, qu’il leur manquait des compétences de data scientist, etc. ils seraient passés à côté de l’occasion d’accroître leurs bénéfices. 

Autre exemple. Cette fois-ci, un grand nom de la distribution se demandait comment augmenter les ventes en magasins.  Les approches envisagées supposaient souvent des stratégies relativement coûteuses visant à augmenter la fréquentation sur les points de vente. C’est là qu’ils se sont interrogés sur les moyens de faire dépenser plus aux clients présents dans les magasins. Ils ont donc analysé les pratiques de consommation sur le point de vente. Ils se sont donné les moyens d’explorer leurs vidéos de surveillance pour en extraire des données sur les comportements des clients dans les magasins. Cette recherche a abouti à une corrélation entre la décision d’achat et les essayages en cabine. Les clients qui essayaient en cabine étaient 50 % plus tentés d’acheter les produits que ceux qui n’essayaient pas. La direction de l’enseigne s’est donc fixé pour objectif d’amener davantage de clients à fréquenter les cabines d’essayage. Plutôt que d’investir dans un plan marketing coûteux, ils ont recruté des vendeurs pour convaincre les clients d’essayer.

Autre point intéressant : comme c’est souvent le cas des nouvelles pratiques associées à la technologie, celle du Big Data tend à démarrer par le département IT, pour se généraliser ensuite au reste de l’entreprise, e la tendance s’inverse, à mesure que les salariés se familiarisent avec la technologie en question. Cette façon de faire est la plus communément admise. Pourtant, avec le Big Data, mieux vaut commencer par le haut et convaincre la direction d’adopter une attitude data-driven et les convaincre de la légitimité de fonder leurs décisions sur l’analyse des données. Dans le cas de l’enseigne de distribution, les pratiques habituelles auraient conduit à la mise en œuvre d’une campagne marketing pour augmenter la fréquentation des magasins, ou à investir pour améliorer le produit. La direction ayant accepté de considérer les choses autrement et de rechercher des modèles en croisant les données disponibles, elle a pu répondre à la question posée avec efficacité et d’une façon bien plus économique.

La problématique du Big Data est bien là pour longtemps, et ne doit pas pour autant être un problème. Les entreprises de toute taille doivent pouvoir en profiter. Commencez par mettre à mal les idées reçues, énoncez une problématique simple, examinez les données à disposition puis adoptez la bonne approche et les bons outils afin d’analyser ces données et d’en extraire des renseignements utiles pour fonder vos décisions en connaissance de cause et, à terme, améliorer la performance de votre entreprise.