Splunk : nouvelle pépite montante du Big Data

Splunk : le Big Data de l'Internet des objets Spécialisé dans l'analyse de données machine, l'éditeur entend mettre Hadoop à la portée des utilisateurs métiers. Objectif : relever le défi du pilotage des clouds et des objets connectés.

Gérer la qualité de service des applications cloud et des objets connectés : c'est le double défi que Splunk entend relever. Lancée en 2006, cette société américaine articule sa technologie autour d'un moteur d'indexation et d'analyse de données machine, capable d'aller puiser dans de nombreuses sources (logs de serveurs, réseaux, informations issues de capteurs, GPS...). Objectif de Splunk : donner les moyens de superviser tout type d'infrastructure IT, qu'elle soit mobile, embarquée, physique, virtuelle, ou dans un cloud (privé ou public). La marque de fabrique de Splunk est d'offrir une solution qui permette le traitement de données en masse, avec à la clé des analyses de corrélation en vue de détecter les erreurs, les signaux faibles, anticiper les événements, incidents...

Une solution utilisée par Box et VeriSign

splunk
Splunk propose une analyse cartographique de l'état des infrastructures IT et autres objets connectés (utilisation de la bande passante et des ressources processeur, mémoire et de stockage). © Capture

La technologie Splunk est utilisée par de nombreuses sociétés américaines. Parmi ses références figurent Box, qui a y recours pour suivre les tendances d'utilisation de ses applications mobiles, mais aussi pour optimiser ses campagnes marketing.

Autre référence de renom, VeriSign a déployé Splunk pour superviser la délivrance de ses certificats numériques, et analyser les tendances et anomalies potentielles de son service de tiers de confiance - via le monitoring de milliards d'événements.

Splunk a commencé à se développer en Europe, et en France, la solution sera d'ailleurs présentée à l'occasion du prochain salon Big Data Paris. Ce développement à l'international fait suite à son entrée en bourse, intervenue début 2012. Il a permis à la société de lever 121 millions de dollars. e-Travel est l'une de ses premières références sur le Vieux Continent. Le site de voyages suisse s'adosse notamment à sa plate-forme pour traquer les erreurs pouvant engendrer un décalage entre l'offre qu'il présente et le résultat final proposé au client, et mieux les anticiper.

Ces derniers mois, Splunk a cherché à évoluer selon deux axes. Premier axe : mieux prendre en compte les besoins d'analyse de données issues des terminaux mobiles. Dans cette optique, la société a acquis en septembre dernier BugSense. Une start-up fondée en 2011, qui commercialise une solution de collecte et d'analyse de données pour suivre la performance et la qualité de service des apps iOS, Android et Windows Phone. 

Mettre Hadoop à la portée des non-informaticiens

Dans sa dernière version, sortie début octobre, Splunk introduit une interface graphique d'analyse (déclinée pour PC, tablette et smartphone) conçue pour être directement utilisable par des équipes métier. Nom de code du projet : Hunk. Très visuelle, cette interface permet de configurer des tableaux de bord et indicateurs, éditables, par le biais de glisser-déposer. Et ce, sans recourir au langage de requêtage de la plateforme (Splunk Search Processing Language). Au programme : des graphiques en barres en passant par des graphiques circulaires, et des jauges, jusqu'à des rapports cartographiques de supervision technique (cf. la capture plus haut). Baptisée officiellement Pivot, l'interface peut manipuler des flux de données en provenance de plusieurs sources.

Autre force de cette interface ? Splunk met en avant sa capacité à s'adosser à un cluster Hadoop (notons en passant que Splunk figurent parmi les principaux contributeurs Hadoop). Derrière Pivot, l'objectif de l'éditeur est ainsi, à travers sa solution Analytics, de démocratiser Hadoop et le Big Data auprès des utilisateurs métier.

Avec Splunk 6, l'éditeur affirme aussi avoir amélioré les performances de sa plate-forme, avec à la clé une vitesse d'exécution des requêtes qui serait 1000 fois plus rapide que dans la version antérieure. La gestion des clusters a aussi été optimisée, avec notamment la possibilité de répartir des instances Splunk dans sur différentes régions géographiques. Enfin, Splunk s'accompagne désormais d'une boîte à outils (JavaScript) pour concevoir des applications web reposant sur Splunk.

Aux côtés de Palantir ou ParStream, il semble bien que Splunk figure désormais au chapitre des solutions Big Data à regarder de près.

 Télécharger Splunk 6

Cloud public / Big Data