Définition : Qu'est-ce que le Big Data ?

Big Data définition et enjeux Pour répondre aux nouveaux enjeux de traitement de très hautes volumétries de données, les entreprises peuvent faire appel à des solutions spécialisées dans le Big Data. JDN Solutions fait le point.

Que recouvre la notion de Big Data ?

Le Big Data fait référence à l'explosion du volume des données dans l'entreprise et des nouveaux moyens technologiques proposés par les éditeurs, en particulier de la Business Intelligence, pour y répondre. Le terme même de Big Data a été évoqué la première fois par le cabinet d'études Gartner en 2008 mais des traces de la genèse de ce terme remontent à 2001 et ont été évoquées par le cabinet Meta Group racheté en 2005 par...le Gartner. 

A quels enjeux répondent les solutions de Big Data ?

Les fournisseurs de solutions ont commencé à élaborer leurs offres à la fin des années 2000 et le mouvement s'est accéléré ces derniers temps avec l'arrivée sur ce créneau d'acteurs historiques comme Oracle, IBM et Microsoft

Les objectifs de ces solutions sont de traiter un volume très important de données aussi bien structurées que non structurées, se trouvant sur des terminaux variés (PC, smartphones, tablettes, objets communicants...), produites ou non en temps réel depuis n'importe quelle zone géographique dans le monde.

L'un des principaux points forts de la base de données NoSQL est sa performance

Sur quelles technologies reposent les solutions Big Data ?

Pour analyser les hautes et disparates volumétries de données, les solutions peuvent s'appuyer sur trois types de technologies distinctes : une accélération matérielle à l'aide de mémoires dynamiques DRAM ou Flash, le recours à des bases de données massivement parallèles (Massively Parallel Processing) ou encore les solutions utilisant des formats de bases de données non relationnelles basées sur NoSQL. 

Quel est l'intérêt de proposer du Big Data basé sur NoSQL ?

L'un des principaux points forts de la base de donnée NoSQL est sa performance. Ce n'est d'ailleurs pas pour rien que des géants du Web comme Facebook, Twitter et ou encore LinkedIn ont choisi de migrer une partir de leurs données dessus. Les atouts de NoSQL sont au moins au nombre de trois : cohérence (visibilité par tous les nœuds d'un système des données identiques à un instant T), haute disponibilité des données même en cas de panne, et possibilité de partitionner tout système distribué.

Quels fournisseurs s'appuient sur NoSQL et Hadoop pour leurs solutions Big Data ?

Les fournisseurs proposant des solutions basées sur ce type de bases de données sont de plus en plus nombreux. Ils y associent également le plus souvent le framework Open Source d'analyse de données en masse Hadoop, comme c'est le cas pour Microsoft et IBM. Mais également Oracle qui de son côté propose une appliance (boîtier) dédiée au Big Data reposant à la fois sur Hadoop mais aussi une version personnalisée de NoSQL. Des pure players se positionnent également sur le terrain du Big Data. C'est le cas de Palantir et Basho. Des acteurs du cloud y sont aussi présents, en intégrant Hadoop à leur infrastructure (Google, Microsoft Azure et Amazon Web Services par exemple).

Le Big Data fait-il partie des préoccupations centrales des DSI ?

Pour le cabinet d'études Gartner, aucun doute là-dessus. Elle arrive même devant le Cloud Computing et l'analyse en mémoire dans le palmarès des 10 tendances technologiques stratégiques pour l'année 2012. Mais le Big Data se fait tout de même voler la vedette par d'autres problématiques clés dont l'intégration dans le système d'information des tablettes ou encore l'Internet des objets.

Microsoft / IBM