La France met le cap sur le Big Data SFR ouvre ses données clients grâce au Big Data

SFR est le premier opérateur mobile français à s'engager dans la vente de données géomarketing issues de ses logs réseau. Objectif numéro un du groupe : faire passer son infrastructure d'un centre de coûts à un centre de profit. Pour ce vaste projet, SFR a reçu le troisième prix des Trophées de l'Innovation Big Data 2013.

pour rendre ses indicateurs représentatifs, les statisticiens de sfr réalise un
Pour rendre ses indicateurs représentatifs, les statisticiens de SFR réalise un redressement des données en fonction de la part de marché de l'opérateur. © morganimation - Fotolia.com

En amont, les données sont collectées par ses antennes relais disséminées sur tout l'Hexagone, et agrégées via une application développée par Intersec (un spécialiste des applications pour opérateurs de téléphonie). Anonymisées, elles sont ensuite consolidées au sein de vastes plates-formes conçues pour traiter de gros volumes.

Derrière cette infrastructure, deux technologies sont déployées : un SGBD traditionnel (Microsoft SQL Server), et le système de fichiers distribués Hadoop. SFR entend ainsi se donner le temps d'éprouver deux voies technologiques possibles, avant de prendre la décision de s'orienter vers l'une ou l'autre.

En aval, une batterie d'outils de datavizualisation entre en action pour exploiter les données. SFR les commercialise directement, ou via son partenaire Web Géo Services et ses services de datavizualisation cartographique. Elles sont proposées sous forme de rapports, ou d'alertes - en pull ou push.

Un milliard d'événements collectés quotidiennement

Au total, un milliard d'événements (action d'allumer ou éteindre un terminal, passage d'appels...) sont remontés du réseau, et traités chaque jour. Un flux interne qui est également croisé avec des sources externes : Open Data, bases de partenaires, données sociodémographiques, données du cadastre, enquête ménages déplacements... 

"Les enchainements d'événements émis par les mobiles permettent de suivre la densité et les flux de population que ce soit au niveau macro, national et urbain, que micro selon la topologie du réseau", explique-t-on chez SFR. "Notre dispositif nous a permis par exemple d'évaluer à 389 500 le nombre de visiteurs du Festival de Cannes en 2012, et d'observer un pic de fréquentation le 18 mai 2012 à 17h." Autres exemples d'indicateurs : le suivi de la diffusion des passagers ayant pris un train à la gare Montparnasse, ou encore la fréquentation des lignes du métro parisien selon l'heure de la journée.

"Ces données peuvent intéresser des acteurs du transport ou les collectivités locales", note-on chez SFR. Mais le secteur de la distribution représente aussi l'une des principales cibles du groupe. L'opérateur offrant notamment la capacité de définir la provenance des clients visitant un centre commercial ou un supermarché.