La plateforme parisienne automatise l'indexation et le catalogage des données. Le défi ? Faciliter et fluidifier leur exploitation par les équipes business.

Editeur d'une plateforme de data management, le français Castor boucle un tour de table de série A d'une valeur de 23,5 millions de dollars. Il a été mené par le fonds d'investissement britannique Blossom Capital. Plusieurs business angel ont également participé, parmi lesquels Florian Douetteau (fondateur de Dataiku). Les investisseurs privés déjà présents au capital remettent au pot. L'opération fait suite à une levée d'amorçage de 2,6 millions d'euros réalisée en novembre 2019.

Fondé par quatre data scientists (Xavier de Boisredon, Amaury Dumoulin, Tristan Mayer et Arnaud de Turckheim), Castor commercialise une plateforme de data catalog en mode cloud. "Bien plus qu'une solution de catalogue de données traditionnelle limitée à la mise en conformité, elle vise plus globalement à mettre les informations à la portée des équipes data comme des équipes métier, du marketing à la finance en passant par les opérations et le produit", explique Xavier de Boisredon, chief operating officer de la start-up.

Un Wikipedia des données

La solution de Castor s'articule autour d'un moteur de recherche taillé pour indexer les jeux de données présents dans les différents silos de contenu de l'entreprise. Ses connecteurs se banchent sur les data platform parmi les plus populaires : Amazon Redshift, Azure Synapse, Google BigQuery, PostgreSQL, MySQL ou encore Snowflake. Mais aussi sur des outils de data visualisation comme Looker, PowerBI ou Tableau. En aval, l'application décrypte les métadonnées en vue de documenter automatiquement les informations et tableaux de bord qui auront été référencés.

"Les entreprises produisent tellement de données que c'est souvent le chaos. Castor unifie cet ensemble, le rend cohérent et le démocratise"

"Le moteur de recherche est ainsi combiné à un Wikipedia des données que l'on peut enrichir manuellement", précise Tristan Mayer, CEO de Castor. Pour générer cette documentation, la solution reconstitue l'arbre généalogique des données via un système de data lineage. Objectif ? Répondre à un maximum de questions que se posent les collaborateurs autour des data sets et tableaux de bord existants. D'où vient l'information ? A quelle ligne métier appartient-elle ? Quelles transformations a-t-elle subies ? Au sein des data warehouse, certaines colonnes sont-elles équivalentes ?

"Les entreprises produisent tellement de données que c'est souvent le chaos. Castor vient unifier cet ensemble, le rendre cohérent et le démocratiser en décryptant son contexte de production", résume Tristan Mayer. Parmi les principaux cas d'usage, le CEO évoque l'onboarding de salariés. "Grâce à Castor, les nouveaux entrants bénéficient d'un guide de lecture de la data. Ce qui leur permet de gagner un temps précieux", argue Tristan Mayer. "Quant aux collaborateurs sur le départ, ils disposent d'un environnement où livrer leurs connaissances relatives aux données pour ne pas rompre la chaîne."

Une IA sous le capot

La priorité de Castor ? Renforcer son équipe commerciale déjà présente aux Etats-Unis où elle compte la moitié de ses clients. L'ouverture d'un premier bureau outre-Atlantique (à New York) est prévue cet été. "La stratégie consiste d'abord à accélérer aux USA où le SaaS a été adopté plus rapidement puis, dans un second temps, à capitaliser sur cette expérience pour croître en Europe", confie Tristan Mayer.

La R&D restera basée en France. "En matière de produit, nous allons nous concentrer sur trois axes : d'abord optimiser la recherche et l'analyse de l'information en vue de la rendre toujours plus accessible, ensuite développer des fonctions de collaboration et d'animation de communautés, enfin améliorer la santé des données, notamment en supprimant les redondances et en optimisant les requêtes", détaille Tristan Mayer. Autre évolution au programme : l'intelligence artificielle. Sur ce point, Castor a déjà recours au machine learning pour analyser l'usage de la data en vue de faire des recommandations d'architecture. "Nous utilisons aussi l'IA pour personnaliser les résultats de recherche en fonction de l'historique de l'utilisateur. Nous sommes capables de lui proposer jusqu'à des dashboards particuliers voire même des jointures entre deux tables d'une base de données", ajoute-t-on chez Castor.

De 25 salariés aujourd'hui, la jeune pousse compte passer à un effectif de 50 à 70 collaborateurs d'ici un an. L'enjeu ? Maintenir un taux de croissance mensuel de l'activité de 40%. Revendiquant une cinquantaine de clients à ce jour, Castor affiche Deliveroo, Canva, ManoMano ou Vestiaire Collective parmi ses références. Une belle rampe de lancement.