Les meilleurs projets Big Data français en 2014 2e prix : le Big Data au service de l'IP TV, par Ericsson

Adapter les techniques du Big Data des géants du Web pour réaliser une analyse des usages des services d'IP TV des grands opérateurs. Tel est le défi relevé par Ericsson. L'équipementier a ainsi développé une solution reposant sur un cluster Hadoop, qu'il commence à commercialiser dans le secteur des télécoms. L'objectif étant de répondre à des besoins tant marketing que techniques. 

Personnaliser programmes et publicités en fonction de la météo

franck gallos est data scientist et ingénieur spécialiste big data chez
Franck Gallos est data scientist et ingénieur spécialiste Big Data chez Ericsson. © Ericsson

"Nous corrélons les données des usages IP TV avec des informations météorologiques mais aussi sociales : vacances scolaires, évènements politiques ou sportifs, campagnes publicitaires...", commente Franck Gallos, data scientist et ingénieur spécialiste du Big Data chez Ericsson. En ligne de mire : produire des statistiques via des rapports personnalisés, voire même directement alimenter les systèmes opérationnels des opérateurs. "Si la météo prévoit qu'il pleuve sur une certaine zone pendant une période donnée, il sera ainsi possible de décider de proposer un programme vidéo supplémentaire aux abonnés de la région concernée. A l'inverse, si l'on sait que les utilisateurs passent moins de temps à consommer le service car il fait beau, l'opérateur pourra alors s'orienter vers une opération de maintenance. Ce qui réduira la gêne occasionnée compte-tenu de la baisse d'audience anticipée", indique Franck Gallos.

Dans la même logique, la solution d'Ericsson est aussi conçue pour optimiser le ciblage publicitaire. Grâce à elle, l'opérateur sera par exemple en mesure de programmer la diffusion d'une publicité pour une boisson désaltérante dans une région et sur un créneau associés à des prévisions de fortes températures. Mais aux côtés du facteur météo, Ericsson est aussi capable d'enrichir ses modèles avec des informations publiées sur les réseaux sociaux et portant sur les programmes télévisuels concernés. Mais aussi avec des données marketing et sociologiques liées à l'audience des campagnes ou bandeaux publicitaires diffusées.

La technologie Hadoop de Cloudera pour traiter 1 To en 25 minutes

Nombre de nœuds, nombre de CPU, niveau mémoire vive et de stockage... Les données sont collectées dans un cluster Hadoop (fourni par Cloudera) dont l'architecture a été finement pensée et équilibrée pour optimiser les traitements. Des fonctions mathématiques y sont ensuite exécutées pour bâtir les analyses prévisionnistes. "Nous utilisons une approche différente du datamining et de la recherche de corrélation basée sur des méthodes statistiques", explique Franck Gallos. "Nous posons des hypothèses de départ à partir de variables explicatives, comme les données météorologiques, que nous vérifions ensuite." Et grâce à Hadoop, le résultat est calculé en moins d'une heure, ce qui permet de relancer un calcul au tant de fois que nécessaire pour aboutir à un résultat au plus juste. 1 To de données structurées et semi-structurées peuvent être traitées en moyenne en 25 minutes.

Sa solution tout juste commercialisée, Ericsson planche sur un premier proof of concept pour un grand opérateur. Il recouvre des volumes de données IP TV de l'ordre de 50 Go par jour en moyenne (en excluant donc les données météo), soit un total d'environ 16 To sur 12 mois.

la solution media statistics d'ericsson s'appuie sur la technologie hadoop de
La solution Media Statistics d'Ericsson s'appuie sur la technologie Hadoop de Cloudera. © Ericsson