Les nouveaux terrains de jeu du Big Data Le Big Data s'impose dans l'énergie via le smart grid

Linky, c'est sans nul doute l'objet connecté qui fera entrer le Big Data dans tous les foyers français. Le compteur intelligent d'ERDF est en effet l'équipement Big Data par excellence. 35 millions doivent être déployés dans les foyers français d'ici 2020 et, si le rythme d'une mesure toute les 10 minutes est retenu, ce sont 1 800 milliards d'enregistrements qui vont devoir être stockés chaque année par le distributeur d'énergie, soit 120 To de données brutes.

le distributeur d'électricité italien enel a lancé le déploiement de compteurs
Le distributeur d'électricité italien Enel a lancé le déploiement de compteurs intelligents dès 2001. © Enel

Pour choisir l'architecture Big Data qui allait devoir absorber ce flux de données colossal, mais aussi permettre aux experts de réaliser des analyses et des requêtes complexes, EDF R&D a réalisé une étude très poussée de l'architecture Hadoop, avec un cluster de 20 nœuds, et 336 cœurs de calcul. Une étude qui a permis de valider la faisabilité du projet sur Hadoop, avec un stockage sur le système de fichiers HDFS, des requêtes via Hive.

L'étude a été réalisée sur Hadoop, mais aussi sur les offres VLDB (Very Large Database) du marché. C'est finalement cette seconde voie qui a été privilégiée, avec le choix de l'offre Teradata pour supporter l'infrastructure base de données de Linky.

Quand l'analytique débusque les abonnés fraudeurs

Dans le déploiement des compteurs intelligents, l'Italie a pris de l'avance sur la France. Enel, le principal distributeur d'électricité en Italie, a lancé le déploiement de compteurs intelligents dès 2001, notamment pour lutter contre la fraude, très importante dans le pays. Plus de 30 millions de compteurs intelligents ont déjà été installés dans la botte italienne. C'est, pour l'heure, le plus gros déploiement dans le monde, devant le Royaume-Uni et la Suède. Ceux-ci n'envoient l'information de consommation qu'une fois par semaine, avec une fréquence d'échantillonnage d'une mesure toutes les 15 minutes.

Enel a confié à Capgemini la mise au point de la technologie de détection de fraude à partir de ces données. "L'idée de départ était de mettre au point des algorithmes détectant la fraude avant d'envoyer un agent sur place", explique Manuel Sevilla, directeur technique global de la division Business Information Management de Capgemini. "Grâce à cet algorithme, la fraude a été grandement réduite, non seulement le ratio entre puissance livrée et puissance facturée, mais aussi du point de vue de l'efficacité des interventions des équipes de terrain qui s'est améliorée." Guidées par les résultats de l'algorithme, les équipes de contrôle ont vu leur taux de succès passer de 25% à 75%.

Un réseau de distribution optimisé grâce aux données

ge energy, alstom, siemens et schneider electric ont déployé des infrastructures
GE Energy, Alstom, Siemens et Schneider Electric ont déployé des infrastructures Big Data pour recueillir les données de leurs équipements de distribution électrique. © Siemens

Autre volet du smart grid impacté par les technologies du Big Data : le fonctionnement du réseau de distribution électrique lui-même. Tous les fournisseurs de transformateurs électriques ou de boitiers de contrôle/commande utilisés dans les réseaux électriques associent aujourd'hui leurs équipements à des services Big Data. GE Energy, Alstom, Siemens ou encore Schneider Electric ont déployé des infrastructures Big Data qui recueillent les données issues des équipements de distribution. L'objectif est d'optimiser la distribution électrique en fonction de la demande, c'est la base de l'approche du smart grid.

Un autre objectif de ces nouveaux services, c'est aussi de sécuriser le réseau contre d'éventuels aléas. Ainsi, Pascal Brosset, à la tête de la stratégie technologique de Schneider Electric explique : "pour prendre un exemple, nous avons développé une application qui permet de prévoir l'impact d'événements météorologiques extrêmes sur un grid afin de gérer au mieux les conséquences d'une tempête. C'est quelque chose que nous avons conçu sur notre plateforme Big Data et qui met en œuvre ce que l'on nomme du Complex Event Processing ou CEP". Il précise : "on corrèle les événements qui remontent des équipements du grid avec les informations de contexte qui proviennent du système météorologique. Ainsi, on peut prendre à la volée des décisions afin d'assurer le fonctionnement du réseau en dépit des conditions météorologiques."