Les lacs de données : tremplin pour l’innovation

Les lacs de données, ou Data lakes, deviennent de plus en plus indispensables à mesure que les entreprises amassent les données générées par les connexions M2M, les réseaux sociaux et leurs collaborateurs distants.

Pour démystifier les lacs de données, il faut faire la part des choses et ne retenir que l’essentiel pour envisager les applications possibles, surtout dans le contexte de l’agilité, des capacités et de la flexibilité du Cloud Computing.
Chaque entreprise doit absolument réfléchir aux meilleurs moyens d’explorer ces immenses étendues de données pour guider leurs efforts d’innovation et leurs orientations stratégiques. Et le plus tôt sera le mieux. 

Qu’est-ce qu’un lac de données ?
Un lac de données est un vaste référentiel où les données sont conservées dans leur forme native en attente d’être interrogées. L’implémentation d’un lac de données sous-tend les systèmes de Business Intelligence en temps réel, les efforts d’amélioration de l’expérience client, et l’accélération de la croissance et de la performance de l’activité. Selon le Gartner, « En 2020, on se servira de l’information pour réinventer 80% des processus métier et des produits de la décennie précédente, les digitaliser ou les éliminer ». Contrairement aux solutions de stockage traditionnelles où les données sont hébergées en silos, dans les lacs de données, tous les octets d’information sont conservés au même endroit, sous forme de données brutes, en prévision d’intégrations ou d’analyses.

Le risque que les lacs de données se transforment en cimetière
Les aspects négatifs des stratégies liées aux données qui reviennent le plus souvent sont l’incapacité à collecter des données, la segmentation en silos, ou la collecte d’énormes quantités de données mais sans la technologie ni l’expertise pour les traiter efficacement. Résultat ? Un cimetière de données. Gartner prévient d’ailleurs les DSI qu’ils ont intérêt à bien gérer leur lac de données sous peine de le voir se transformer rapidement en lieux de déshérence. Les données sont une fantastique opportunité pour les entreprises d’obtenir les bonnes réponses aux bonnes questions. Il est donc essentiel qu’elles adoptent une stratégie soignée pour leurs données, sophistiquée, aux multiples facettes et qui repose sur des bases sûres et fiables, de façon à optimiser leur performance.

Les opportunités
En résumé, les données ont le pouvoir de transformer positivement les résultats des entreprises. Comme le souligne le rapport State of the Market: Internet of Things 2015, les données aident les entreprises à :
  1. Prendre le contrôle et réagir par une automatisation accrue, le contrôle à distance, l’analyse et le reporting.
  2. Se transformer et explorer en favorisant de tout nouveaux business models, le lancement de produits et de services, et des économies fondées sur les données.
  3. Connecter et surveiller en reliant entre elles de petites quantités de données pour inscrire la surveillance manuelle dans un seul processus organisationnel.
  4. Anticiper et adapter à l’aide de l’analyse prédictive complexe pour que l’action préventive reste agile.

Les lacs de données et le Cloud Computing

La stratégie de « data lake » la plus concluante inclura inévitablement les capacités de stockage et de calcul du Cloud Computing, flexibles et économiques. Les solutions Cloud peuvent en effet héberger des tonnes de données brutes et leurs capacités peuvent être revues à la baisse quand les entreprises produisent moins de données, comme c’est le cas pour les commerçants juste après les fêtes de fin d’année. Et à l’inverse, elles peuvent redoubler de puissance pour traiter les données, quand il le faut uniquement.

Voici les avantages des lacs de données Cloud :
  1. L’agilité accrue : le Cloud met à profit l’analyse prédictive complexe dont l’intensité peut être adaptée en fonction de la demande.
  2. La sécurité intégrée : il faut inscrire d’emblée des mesures de sécurité robustes dans sa stratégie Big Data pour protéger au maximum l’infrastructure et les données des clients.
  3. L’évolutivité massive : avec l’augmentation de taille et de complexité des données, l’infrastructure réseau doit être suffisamment flexible et fiable pour supporter le transport des données en toute sécurité.
Il ne fait aucun doute que le Big Data puisse produire des résultats exceptionnels. Les entreprises qui sauront extraire des renseignements utiles des lacs de données comprendront mieux le monde dans lequel elles évoluent et elles s’en serviront pour gagner en compétitivité. Mais sans solution de stockage des données, capacité d’analyse et stratégie d’exécution adaptées, les données ne sont rien de plus que de l’information. Il faut passer à l’action afin de convertir l’information en ‘Business Intelligence’ apte à avoir une incidence positive sur l’entreprise.

Stockage / Innovation