Collibra, la nouvelle licorne européenne du data management

Collibra, la nouvelle licorne européenne du data management Après avoir levé cent millions de dollars, la scale-up belge change de dimension. Elle entend répondre à deux enjeux : valoriser les données d'entreprise et garantir le respect des réglementations.

La Belgique tient sa première licorne. En levant, fin janvier, cent millions de dollars auprès de CapitalG, le fonds d'investissement d'Alphabet, la maison mère de Google, Collibra a dépassé le milliard de dollars de valorisation. La scale-up spécialisée dans la data intelligence avait déjà collecté 133 millions de dollars depuis sa création en 2008. Avec cet argent, son PDG fondateur, Félix van de Maele voit grand. Selon le site belge L'Echo, il vise un chiffre d'affaires de cent millions d'euros cette année et le double d'ici deux à trois ans. Par ailleurs, ce diplômé d'un master en ingénierie informatique à l'Ecole des Mines de Nantes ne ferme pas la voie à une introduction en bourse.

A l'origine, Collibra est une spin-off de la Vrije Universiteit Brussel (VUB), une université de langue néerlandaise basée Bruxelles, où les quatre fondateurs de la société étaient chercheurs. Si elle maintient ses origines européennes, Collibra a établi son siège à New York et a ouvert un bureau parisien fin 2015. Collibra emploie plus de 450 collaborateurs et table sur 200 recrutements en 2019. L'éditeur revendique plus de 350 clients dans le monde dont une filiale d'Axa (Axa XL).

Cette forte croissance, Collibra la doit à son positionnement au cœur des grandes tendances IT du moment. C'est l'un des premiers éditeurs à avoir abordé le sujet de la gouvernance des données sur un angle opérationnel, avec la volonté de réunir sur une même plateforme les responsables de la data, l'IT et les métiers.

Un portail d'accès au data lake

Historiquement, Collibra s'est d'abord spécialisée dans le contrôle de la donnée avec pour objectif premier la mise en conformité de ces dernières au cadre réglementaire. Au-delà des règlements internationaux applicables à toutes les entreprises (normes comptables IFRS, RGPD), les banques (avec BCBS 239, Bâle III, CRR) et les sociétés d'assurances (Solvabilité II) sont particulièrement ciblées par l'acteur.

Depuis quelques années, Collibra s'est positionnée sur un autre enjeu : la valorisation des données. "Il s'agit de désiloter les data pour permettre de les croiser et d'en tirer de la valeur", explique Shelemat Daniel, area vice-president de Collibra pour la France. "Mais pour passer de la promesse et de la vision technologique aux bénéfices constatés, il ne suffit pas de déverser les données dans un data lake. Il faut référencer et comprendre ce que l'on met dans le lac de données sinon les datas scientists passent plus de temps à chercher et à saisir le sens de l'information qu'à la valoriser."

"L'objectif : permettre de trouver, comprendre et se fier à la donnée d'entreprise sous toutes ses formes"

Collibra se superpose donc au data lake pour en devenir en quelque sorte un portail d'accès permettant aux data analystes et autres data scientists de disposer d'un catalogue qui "donne du sens aux données". La plateforme dispose pour cela de toute une panoplie d'outils : un glossaire professionnel, un dictionnaire de données, un gestionnaire de règles, des cartes de lignage, des tableaux de bord, des workflows et des connecteurs pour l'intégration au système d'information.

Shelemat Daniel fait une analogie avec la transformation dans le monde industriel de produits bruts en produits semi-finis puis finis. De la même manière, Collibra va référencer des données plus ou moins complexes - données élémentaires, indicateurs de performance (KPIs), rapports - mais aussi les modèles algorithmiques, les règles de transformation ou les règles de qualité. "L'objectif est de permettre aux entreprises de trouver, comprendre et se fier à la donnée d'entreprise sous toutes ses formes", précise-t-elle.

Shelemat Daniel observe un nombre croissant de cas d'usage portant sur les modèles algorithmiques. "Il y a un besoin de transparence sur le fonctionnement d'un algorithme d'intelligence artificielle, de comprendre comment la donnée a été traitée." Au-delà de l'apport financier, l'investissement de CapitalG permettra à Collibra de bénéficier de l'expertise et du savoir-faire de Google dans le domaine de l'intelligence artificielle.

Un data basket à la manière d'Amazon

Dans la pratique, la fonctionnalité qualifiée "data basket" de Collibra est similaire à ce que propose Amazon. Depuis un site d'e-commerce, un internaute place des produits dans un panier puis règle ses achats en un clic. De la même manière, un data scientist évoluant dans l'environnement Collibra place un jeu de données dans un panier puis va demander l'autorisation d'y accéder à son propriétaire via un workflow de validation-approbation.

Au-delà de la plateforme proprement dite, Collibra propose différentes solutions. On retrouve tout d'abord Collibra Data Governance Center (DGC), une brique de gouvernance des données. Ensuite, Collibra Connect relie la plateforme à différentes sources de données, aux applications métier, ERP et autres CRM. Quant à Collibra On-the-Go, il permet aux gestionnaires de données et aux utilisateurs d'accéder à la plateforme sur PC ou en situation de mobilité (sur terminaux iOS, Android).

Un autre module est dédié à la gestion de la privacy. Il gère la conformité avec le RGPD ou le CCPA, son équivalent en Californie, afin de répondre aux droits des personnes (droit d'accès, droit d'opposition, droit à l'oubli…). A noter que Collibra a récemment noué un partenariat avec Tableau.  Son intégration à ce dernier permet de lire les métadonnées directement depuis le logiciel de data visualisation.

"La majorité des grandes banques françaises clientes"

Si Collibra compte "beaucoup d'entreprises du CAC 40" parmi ses références, les ETI qui ont une approche data driven sont aussi intéressées par son offre. "La majorité des grandes banques françaises" sont clientes de l'éditeur belge, affirme Shelemat Daniel. "Sur le marché français, les banques et les assureurs ont été les premiers à se lancer dans la gouvernance des données poussés par la pression réglementaire." Collibra compterait aussi des références parmi les constructeurs automobiles, les équipementiers en électronique, les acteurs de l'industrie pharmaceutique, de l'énergie, des transports et du secteur public.

Dans son dernier quadrant magique remontant à août 2018, Gartner classe Collibra parmi les leaders du marché des solutions de management des métadonnées aux côtés d'Informatica et d'un autre pure player, Alation. La société belge se situe devant des ténors généralistes comme IBM, Oracle ou SAP. Le cabinet d'études salue son approche innovante mais aussi pédagogique, "la pratique de la gestion des métadonnées [étant] souvent un défi pour les clients qui s'engagent dans cette voie." L'éditeur propose à cet effet une académie en ligne (Collibra University) et une plateforme communautaire (Collibra Community). En revanche, Gartner relève des difficultés dans l'ingestion des métadonnées et dans l'accès au support. Un tiers des clients souhaitent des mises à niveau de versions plus fréquentes. Pour le cabinet d'études, Collibra doit aussi faire face au défi que lui impose son importante croissance. Un problème de riche...