Cloud : Spotify migre toute son infrastructure applicative chez Google

Le numéro 1 du streaming musical a décidé de déprovisionner tous ses serveurs internes et de basculer l'intégralité de son infrastructure informatique chez Google.

Spotify a commencé à basculer l'intégralité de son infrastructure applicative sur le cloud de Google. Jusqu'à aujourd'hui basé sur des serveurs maison, il s'agit là d'un backend qui gère pas moins de 75 millions d'utilisateurs et quelque 2 milliards de playlists. Une base de contenu au sein de laquelle les applications Spotify permettent de réaliser des recherches (par artiste, genre...) tout en proposant des suggestions personnalisées.

Une migration progressive, par microservice

C'est l'ensemble de ce socle logiciel orchestrant l'application de Spotify qui est en train de basculer vers Google Cloud Platform (les fichiers musicaux resteront eux chez Amazon S3). Pour sa migration, la start-up a découpé le projet en deux lots : les services d'une part, les données d'autre part. Côté stockage, Spotify  fait notamment appel à Google Cloud Datastore et Cloud Bigtable. En matière de logique applicative, c'est sans surprise les instances Google Compute Engine qui sont sollicitées (et leurs capacités de stockage SSD). L'architecture de l'application reposant sur une infrastructure de microservices, la migration est réalisée progressivement (par microservice).

Pour gérer les transferts de données, Spotify a recours aux services de cloud réseau de Google (Direct Peering, Cloud VPN et Cloud Router).

La plateforme Big Data bascule aussi chez Google

Ce n'est pas tout. Car Spotify entend aussi migrer sa plateforme "Big Data" interne historique (basée sur Hadoop, MapReduce et Hive) vers Google Cloud Platform. Pour ses traitements de données en masse, la société de Stockholm va ainsi bientôt s'adosser à la base BigQuery ainsi qu'à Dataproc - un service managé qui donne accès à Hadoop MapReduce, Spark, Pig, et Hive en mode cloud. C'est donc à ces briques que Spotify compte désormais recourir pour tous ses besoins de Business Intelligence.

Enfin pour gérer les flux entre ses différents systèmes reposant sur Google Cloud Platform, l'acteur prévoit de recourir à Cloud Pub/Sub, le middleware orienté messages de Google, ainsi qu'à son service d'extraction, de transfert et de chargement de données (ETL) Google Cloud Dataflow. 

Google / Spotify