Dossier Les nouveaux terrains de jeu du Big Data
C'est chez les géants du net qu'est né le concept et les technologies du Big Data. Mais ce domaine s'étend désormais bien au-delà du web, dans la finance, l'automobile, l'énergie...
C'est dans la Silicon Valley, chez les géants du net, qu'est né le concept et les technologies du Big Data. C'est pour indexer Internet que Google a inventé l'architecture distribuée de traitement MapReduce, la base du framework Hadoop. Que ce soit pour indexer Internet, segmenter leurs utilisateurs pour leur proposer de la publicité ou des services, les Google, Facebook, LinkedIn et Yahoo ont véritablement inventé le Big Data moderne. C'est donc tout naturellement que les services marketing des sites d'e-commerce et de la distribution ont été les premiers à s'intéresser à leur approche. Eux-aussi doivent segmenter leurs clients, eux-aussi doivent analyser les ventes pour affiner leurs stratégies marketing.
Tous les secteurs d'activités embrayent derrière le marketing
Aujourd'hui, bien d'autres secteurs commencent à s'intéresser au Big Data. Réseaux de distribution d'énergie, services des eaux, industrie, administration, banques, tous lancent des projets s'appuyant sur des briques initialement développées pour le web.
Plusieurs facteurs les poussent aujourd'hui à franchir le pas. D'une part, la maturité des technologies permet maintenant de les exploiter sans avoir à entretenir un bataillon entier de développeurs spécialisés. Cloudera et Hortonworks s'imposent comme les distributions open source les plus diffusées actuellement et simplifient grandement la mise en place d'une plateforme de Big Data.
Un second facteur pousse en faveur de l'adoption du Big Data : c'est le cloud computing. Plus besoin d'acheter un coûteux cluster de serveurs, d'installer toutes les couches logicielles nécessaires avant de lancer le premier traitement Hadoop. En quelques clics, on peut mobiliser plusieurs dizaines voire centaines de nœuds de traitement Hadoop sur Amazon Web Services ou Microsoft Azure. On ne paye qu'à la puissance réellement consommée et avec des services tels qu'Amazon EMR (Elastic MapReduce) ou HDInsight sur Microsoft Azure. L'essentiel du travail d'intégration informatique est déjà réalisé.