Comment la base de données Neo4J entend défier Oracle

Comment la base de données Neo4J entend défier Oracle Mi-juin, l'éditeur californien bouclait un tour de table de 325 millions de dollars. La plus grosse levée de fonds de l'histoire des bases de données privées.

Fondé en 2007, Neo4J fait historiquement de la base de données de graph sa marque de fabrique. Le 17 juin 2021, le Californien crée la surprise. Il annonce avoir bouclé un tour de table de série F de 325 millions de dollars. Menée par Google Ventures, l'opération hisse sa valorisation à pas moins de 2 milliards de dollars. Il s'agit de la plus importante levée consacrée à une base de données privée de l'histoire. Elle porte à 500 millions le total des fonds glanés par la société de San Mateo depuis sa création. Pour le consultant américain Peter Cohan, la prochaine étape pourrait bien être l'IPO, avec en ligne de mire la volonté de proposer une alternative crédible à la base Oracle.

"Lors du lancement de Neo4J il y a 14 ans, nous avons évidemment étudié le paysage de l'époque en matière de data. Nous nous sommes rendu compte que Google, Facebook, Yahoo et eBay étaient obligés de développer leur propre infrastructure (de graph, ndlr) pour gérer leurs masses de contenus web", se rappelle Emil Eifrem, CEO et fondateur de Neo4j. "Nous avons réalisé que les entreprises du Global 2000 seraient confrontées au même problème plus tard." Comparé à un lourd serveur relationnel articulé autour de tableaux stockant les données en lignes et en colonnes, une base de graph stocke des points d'information, tels que des documents ou des clés-valeurs, et les relations qu'ils entretiennent.

Neo4J se hisse en 18e position du dernier classement DB-Engines des bases de données les plus populaires. © JDN / Capture

"Du fait de sa structure transversale, une base de graph peut rapidement être un million de fois plus rapide qu'une base relationnelle. Sa vitesse, d'environ 1000 fois plus élevée, se maintient même si le volume à traiter augmente et atteint lui-même une masse mille fois plus conséquente", explique Emil Eifrem. La performance augmente ainsi de manière exponentielle.

Un modèle open source

Face à Oracle, Neo4J avance ses pions. Aux côtés des performances, il met en avant son modèle open source. Son édition communautaire permet de créer des graphs comptant 34 milliards de nœuds, et bénéficiant chacun d'une puissance de 4 CPU. De quoi réaliser un premier développement avant un passage à l'échelle via l'offre payante. Baptisée Neo4J Aura, une déclinaison ciblant les PME est proposée en parallèle en mode cloud. Egalement dotée d'une version gratuite (limitée à une seule base de données), son équivalent payant affiche un prix d'entrée de 65 dollars par mois. Un tarif qui autorise un nombre illimité de bases, avec une capacité de stockage maximale de 64 Go chacune.

Bloom est l’application de data visualisation conçue par Neo4jp pour naviguer au sein de sa base de données de graphs. © JDN / Capture

Au fil des années, d'autres acteurs sont certes venus se positionner sur le créneau des bases de données de graph open source. C'est le cas d'ArangoDB, DataStax, OrientDB, RedisGraph ou encore TigerGraph. Côté fournisseurs de cloud, Microsoft a sorti en 2017 sa propre alternative propriétaire avec Azure Cosmos DB. En 2018, c'est au tour d'Amazon de lancer la sienne avec Neptune. Oracle a aussi réagi, mais beaucoup plus récemment. L'éditeur de Redwood Shores planche sur Graph Studio. Un environnement taillé pour faciliter la modélisation et le déploiement de graph sur Oracle Autonomous Database.

"Nous avons grignoté une mince tranche du Global 2000 en Amérique du Nord et en Europe qui représente 80% des revenus des bases d'Oracle"

Comparé à Oracle et à cette pléiade de concurrents, Neo4J bénéficie néanmoins d'une technologie nettement plus mature. En 14 ans, la société a multiplié les cas d'usage : détection des fraudes, des réseaux criminels ou terroristes, gestion des risques dans la finance, optimisation de la chaîne logistique, gestion des réseaux dans les télécoms et le numérique, graph social...

Et il ne s'arrête par là. En 2020, l'entreprise a introduit Neo4j pour Graph Data Science. Il s'agit selon elle de la première plateforme de machine learning conçue pour exploiter le pouvoir prédictif du graph, en vue par exemple d'anticiper les fraudes ou d'accélérer la recherche pharmaceutique. Plus récemment, Neo4j BI Connector est venu complété l'édifice. Objectif affiché : ouvrir la base de graph à des applications de data visualisation comme Looker ou Tableau. En parallèle, un autre connecteur a été livré pour gérer des intégrations bidirectionnelles avec Apache Spark.

75% du Fortune 100 comme clients

A ce jour, Neo4J revendique 800 clients payants dont 75% du Fortune 100. Parmi ses références figurent Airbnb, Airbus, AstraZeneca, ebay, Monsanto, la NASA, Orange, Telenor, UBS, Volvo ou encore Walmart. "Nous avons déjà grignoté une mince tranche du Global 2000 en Amérique du Nord et en Europe, qui représente 80% des revenus des bases de données d'Oracle", se félicite Emil Eifrem.

Pour la suite, le CEO compte intensifier les développements produit et étendre les partenariats à de nouveaux acteurs du cloud. Neo4j a ouvert des bureaux en Allemagne, au Royaume-Uni et en Suède. Mais aussi à Singapour en vue d'accroître son développement commercial en zone Asie-Pacifique. D'après le cabinet MarketsAndMarkets, le marché de la base de données orientée graph va passer de 1 milliard de dollars en 2019 à près de 3 milliards en 2024. "L'activité est tirée par la croissance de la demande en capacités système à traiter les requêtes à faible latence et par l'adoption d'outils et de services de base de graph reposant sur l'IA", analyse MarketsAndMarkets.