La France met le cap sur le Big Data Coface Services : analyser en temps réel des milliards de données

Proposer la base de données la plus riche sur les entreprises françaises. Tel est l'ambitieux objectif de Coface Services. Pour répondre à la montée en puissance des besoins en matière de marketing en temps réel, la société a lancé en 2013 un nouveau service en ligne : ellicible.fr.

capture d'ellicible.fr.
Capture d'ellicible.fr. © Capture JDN

"Sa vocation est de cibler, trier, ventiler, explorer, segmenter, surveiller et extraire des populations d'entreprises dans un espace multidimensionnel de plusieurs milliards de données", détaille la société. Objectif premier de la solution : rendre les clients plus réactifs en matière d'analyse et d'actions marketing, avec un service de traitement haut de gamme offrant jusqu'à la possibilité d'en réintégrer les données à leur système d'information.

Un service d'analyse temps réel au service des stratégies marketing

Pour relever ce défi, Coface Services a déployé la technologie d'analyse allemande ParStream. Pourquoi ce choix ? Cette solution lui permet de répondre à une double exigence : le traitement d'une volumétrie importante d'une part, la capacité à lancer des recherches sur plusieurs centaines de dimensions avec un faible temps de latence d'autre part. Face à ces deux problématiques, la société avait très vite abandonné l'idée d'une base de données NoSQL, de type Hadoop par exemple. Une infrastructure qui est en effet peu adaptée au temps réel.

A l'inverse, le SGBD de ParStream basé sur SQL semblait mieux adapté. Pour optimiser la performance de son moteur de base de données et sa consommation en ressources machines (CPU, RAM et i/o), cet éditeur fait appel à plusieurs méthodes. Au programme : la compression d'index, le stockage des données en mémoire, un mode de structuration hybride (colonnes / lignes), sans compter le recours au traitement massivement parallèle. Côté couche d'analyse, un mode de recherche à facettes permet en outre d'éviter la lourdeur d'un cube multidimensionnel traditionnel. Au final, ParStream revendique des temps de réponse de l'ordre de quelques millisecondes, même pour des milliards d'enregistrements.