MAAF, MMA et GMF : le Big Data comme moteur de la transformation

MAAF, MMA et GMF : le Big Data comme moteur de la transformation Restructurer un système d'information autour d'un lac de données Hadoop, c'est le pari de Covéa. Un projet présenté lors du salon Big Data Paris 2015 cette semaine.

Avec ses marques MMA, MAAF et GMF, Covéa est leader en France de l'assurance pour l'automobile et l'habitation, et dans les 10 premiers dans les assurances de santé. Et si, comme toutes les grandes entreprises françaises, Covéa négocie un virage vers le digital, le groupe mène une profonde transformation interne, avec trois sociétés jusqu'ici autonomes qui deviennent trois marques d'un même groupe.

guillaume lemele
Guillaume Lemele, directeur des pôles logiciels du SI MMA chez Covéa et en charge du programme ambition client 2020, le grand projet de transformation digitale du groupe d'assurance. © Covéa

Dans cette transformation, la Big Data joue un rôle plus important encore que chez les autres assureurs : "Pour Covéa, le Big Data a un double effet", confie Guillaume Lemele, directeur des pôles logiciels du système d'information MMA chez Covéa. "Comme tous les autres assureurs, nous allons vers le Big Data, mais nous nous servons de ce projet pour nous aider à passer une nouvelle étape dans la vie du groupe puisque désormais Covéa dispose de trois marques, MMA, MAAF et GMF. Le Big Data doit être une opportunité de croiser des données que nous n'avions jamais croisées jusqu'à maintenant."

Responsable du projet Big Data, mais surtout du programme ambition client 2020, c'est-à-dire de la transformation digitale de l'assureur et sa mise en œuvre dans le système d'information, Guillaume Lemele s'est tourné vers Sentelis pour l'aspect conseil et mise en œuvre de la plateforme Big Data.

Covéa veut placer la donnée au centre du SI

Contrairement à beaucoup d'entreprises qui se lancent dans le Big Data pour analyser la donnée client essentiellement pour le marketing, Covéa a adopté une toute autre approche. "Nous avons lancé notre initiative Big Data en 2013-2014 avec pour vision que la donnée est un actif important des compagnies d'assurance. Elle est, d'une certaine manière, notre seul actif matériel. Nous n'avons pas de brevets, nos produits sont copiables par la concurrence, nous n'avons pas de machines, pas d'usines. Nous sommes véritablement une industrie de service, et dans nos métiers, on peut réellement dire que la donnée c'est l'or noir."

Comme toutes les grandes entreprises depuis plusieurs dizaines d'années, les marques de Covéa mettaient en place des bases de données pour répondre aux besoins en matière d'applications et de traitements. "Nous nous attachions essentiellement à la richesse fonctionnelle et aux performances des applications. Cela reste vrai, mais maintenant nous pensons 'les données' en priorité, le cycle vie de la donnée, la gouvernance et la sécurité de la donnée. Le Big Data, c'est avant tout l'opportunité de mettre la donnée au cœur du système d'information", explique Guillaume Lemele.

sentlis
Architecte chez Sentelis, Sébastien Layer défend l'approche "Architecture 3.0" comme moyen de moderniser les systèmes d'information existants à l'aide des technologies Big Data. © Sentelis

Ancien de Capgemini, Sébastien Layer, architecte chez Sentelis ajoute : "très fréquemment dans les entreprises, le Big Data est utilisé comme une réponse technologique à des problèmes purement tactiques : le marketing, la fraude, etc. Ce que nous proposons, c'est un concept d'architecture où la technologie Big Data se place au cœur du SI. Nous le transformons pour le rendre Data Centric, concentrer l'ensemble des données des applications dans un lac commun et homogène. C'est au-dessus de ce lac de données que l'on va ensuite développer un certain nombre d'applications qui seront hébergées sur une plateforme multi-usages, multi-tenant." L'architecte défend le concept de cluster unique pour héberger les données. Un cluster qui va être utilisé de manière transversale dans un certain nombre d'applicatifs qui vont concerner tous les métiers, que ce soit le marketing, la distribution, la comptabilité, l'IT. Le Big Data comme fondement d'une nouvelle architecture de système d'information, c'est la vision Architecture 3.0 telle que la défend cette société de conseil spécialisée dans le Big Data.

Le Big Data permet enfin d'atteindre la vision à 360° du client

La première application née de cette vision, qui vient d'ailleurs d'entrer en production au moment du salon Big Data Paris 2015, c'est le moteur de recherche interne de Covéa. "Nous utilisons le Big Data non pas pour faire de l'analytics, ce que tout le monde veut généralement faire, mais pour réaliser ce qui est un peu le graal du marketing, c'est-à-dire la vision 360° du client", explique Guillaume Lemele. L'idée de ce premier projet est d'accumuler toutes les données stockées par l'assureur sur ses clients dans un cluster Hadoop et d'indexer l'ensemble de ces informations via un moteur de recherche. "Via ce moteur, nous reconstituons tous les liens entre un client, ses contrats, les appels téléphoniques, des documents dans la GED. Il va remonter toutes ces informations sous forme de synthèse pour un distributeur d'assurance, pour le client lui-même, etc.", détaille Guillaume Lemele.

Le choix de la distribution Hadoop de Cloudera, et de SOLR

Un premier "proof of concept" (Poc) a permis de vérifier que l'alimentation du lac de données avec des informations stockées dans les systèmes existants (y compris dans d'antiques mainframes), était possible. C'était un point clé du projet, l'objectif étant de maintenir l'information stockée dans le cluster Hadoop à jour en quasi temps réel par rapport aux applications de production de l'assureur. "Nous ne sommes pas dans une approche Big Data avec une alimentation à J+1 mais bien dans une mise à jour des données à la minute. Lorsque nous vendons un contrat à un client, il faut que cela apparaisse immédiatement dans la vision 360°. En plaçant la donnée au cœur du système d'information, on va 'désiloter' l'information par l'alimentation des systèmes existants. L'idée est ainsi de faire tomber les barrières que l'on a constituées ces dernières années", poursuit Guillaume Lemele. "Beaucoup de données sont aujourd'hui utilisées uniquement dans le but pour lequel elles ont été collectées. On fait du marketing avec des données de relation client, mais on ne les croise pas systématiquement avec les sinistres, avec l'assistance, ou beaucoup d'autres informations dont on dispose par ailleurs. C'est ce qu'on va pouvoir faire avec un lac de données dans lequel on pourra croiser de multiples sources."

Une architecture bâtie sur la distribution Cloudera

Le premier proof of concept Big Data de Covéa a été déployé sur une période de 4 à 5 mois, avec une équipe de 2 à 3 personnes. Le moteur de recherche Vision 360 a été mis à disposition des utilisateurs de l'activité courtage et des agents généraux, tant côté MMA que côté MAAF. Ce Poc a permis à Covéa de valider le choix de la distribution Hadoop de Cloudera. "Hadoop, c'est l'état de l'art de ce qui se fait de mieux dans le Big Data aujourd'hui, et Cloudera en est l'un des acteurs les plus importants", explique Guillaume Lemele. Covéa en a fait la solution Big Data de ses trois marques, sachant que c'est le moteur SOLR qui fournit la vue 360° sur les données. "La solution permet de taper un mot clé, ou simplement une partie d'un mot ou une phrase, et va chercher tout ce qui a pu être indexé. Un aspect intéressant, c'est que l'on obtient des réponses certaines mais aussi des réponses incertaines, ce qui est totalement nouveau dans une vision à 360°", décrypte-t-on chez Covéa. "On va avoir des réponses certaines sur des objets critiques du système d'information : le client appartient à une agence, avec un contrat, des sinistres. Ce sont des liens forts, mais par contre le moteur peut remonter des clients avec le même nom, à la même adresse ce qui veut peut-être dire qu'il s'agit de la même personne."

covea bnig data architecture
L'architecture Big Data conçue par Sentelis pour Covéa. Celle-ci est déployée en 4 exemplaires : un par société, et un quatrième commun (le Data Lab). © Sentelis - Covéa

Pour l'instant, Covéa a choisi de créer un lac de données sur un cluster Cloudera pour chacun de ses trois systèmes d'information. La même architecture est ainsi répliquée pour MMA, MAAF et GMF. Chaque cluster peut héberger 20 To de données brutes ainsi que leur réplication. Plusieurs briques du stack Hadoop de Cloudera ont été déployées pour alimenter en données ces clusters. Sébastien Layer de Sentelis détaille les briques logicielles mises en place chez Covéa pour assurer l'intégration des données : "Il y a d'une part une alimentation batch avec HCatalog et le décodage de fichiers. Rien de très innovant. En revanche, pour les alimentations au fil de l'eau, nous avons eu recours à RabbitMQ en entrée, puis Spark et Flume pour s'interconnecter, et enfin HBase. Flume offre la capacité de lancer directement l'indexation des données, ou bien de déverser les données dans le lac Hadoop", explique cet expert des architectures Big Data.

L'étape suivante de la stratégie Big Data de Covéa, c'est la mise en place d'un Data Lab commun à l'ensemble de l'entreprise. Ce projet devrait être lancé à partir de septembre 2015. "En nous appuyant toujours sur la même architecture, nous souhaitons ainsi déployer un environnement dédié à nos actuaires, au marketing et aux Data Scientists que nous comptons recruter prochainement. Ceux-ci vont disposer des jeux de données et surtout d'un bac à sable pour tester librement des modèles prédictifs, faire de l'analytique, du décisionnel à la mode Big Data, apprendre les usages du Big Data au niveau des métiers", confie Guillaume Lemele. Objectif de Covéa avec cette infrastructure : mettre aux points des méthodes de scoring d'attrition, des algorithmes prédictifs, détecter des signaux faibles, et industrialiser les processus dans cet environnement. "Il s'agira d'aller au-delà de l'approche statistique telle que nous la maitrisons depuis des années", conclut Guillaume Lemele.