Google lance une plateforme cloud pour l'Analytics orientée Big Data

Lors de son événement français Next ce 13 octobre, l'Américain dévoile un environnement cloud d'exploration et de visualisation de données. Il est taillé pour tirer parti de Google BigQuery.

A l'occasion de son événement français Next qui a lieu ce 13 octobre à Paris, l'équipe de Google Cloud Platform annonce l'ouverture mondiale d'un nouveau service : Google Cloud Datalab. "Il s'agit d'un environnement interactif d'exploration et de visualisation de données pour les data scientists", explique Greg DeMichillie, directeur Produit Management de Google Cloud Platform, avant de préciser : "Nous n'avons pas pour vocation, avec ce service, de concurrencer les éditeurs d'outils de data visualisation comme Tableau."

A la différence des solutions paquagées de visualisation de données, Google Cloud Datalab est en effet plutôt taillé pour les profils de développeur. Il repose sur IPython notebook : un shell Pyhon. "IPython notebook permet de réaliser des traitements au sein des données BigQuery, puis de les restituer visuellement, sous forme de graphiques par exemple. Ces notebooks peuvent ensuite être partagés au sein de votre entreprise", détaille Greg DeMichillie.

Un outil compatible avec Hadoop ou Spark

Google Cloud Datalab peut aussi aller puiser dans des données stockées sur Google Cloud Storage, ainsi que dans d'autres écosystèmes technologiques, orientés Big Data, comme Hadoop ou Spark. L'ensemble de ces sources peuvent même être combinées par la solution au sein d'un unique pipeline de données (combinant exploration, transformation et visualisation). Avec la possibilité d'associer plusieurs langages (Python, SQL et BigQuery UDF), Google Cloud Datalab permet enfin de définir et de déployer des modèles de machine learning.

Interface de Google Cloud Datalab. © Google

Google / Big Data