Quel avenir pour les bases de données et la technologie de graphes ?

Sur le terrain des bases de données, nous sommes passés d'une poignée d'options à des centaines, tandis que le secteur testait le stockage sous différentes formes, échelles et modalités. Alors que nous réserve l'avenir ? Le point.

Il y a cinq ans à peine, nous avons observé un vif élan d'intérêt et d'innovation autour des technologies de bases de données. Vous avez entendu les raisons de cet intérêt un million de fois, donc je ne vais pas y revenir, mais il en a résulté le développement rapide de plusieurs types de bases de données. Nous sommes passés d'une poignée d'options à des centaines, tandis que le secteur évaluait différents modèles et testait le stockage sous différentes formes, échelles et modalités. Des ingénieurs avant-gardistes ont testé et lancé des dizaines de nouveaux modèles de données, dont le modèle par clés-valeurs, en colonnes et les graphes.

Il apparaît que les bases de données relationnelles conservent un ancrage solide sur le marché. Toutefois, nous constatons également l'émergence d'une variété de bases de données NoSQL allant de solutions de niches à des solutions génériques avec d'innombrables options intermédiaires. Comme je l'ai écrit, DB-Engines compte plus de 300 options différentes - une vaste gamme de possibilités qui signale que les clients sur le marché cherchent à résoudre une difficulté significative. Toutefois, sur un marché concurrentiel, ce chiffre ne va pas se maintenir éternellement.

Ceci m'amène à mon principal argument : nous sommes à un carrefour en termes de technologies de bases de données. Quand on se tourne vers l'avenir, ne serait-ce que dans cinq ans, le domaine des données prend un tout autre aspect - lequel est la suite logique de la concurrence sur le marché amenant à se positionner sur une sélection de bases de données qui ont la capacité de changer l'activité de façon spectaculaire. Je pense que d'ici 2020, nous verrons une subdivision des bases de données en trois catégories :

  1. Le premier segment sera le domaine relationnel. Ce segment ne va sidérer personne avec ses chiffres de croissance, mais il reste celui de la technologie dominante qui avance à pas mesurés. Il existe d'innombrables applications et scenarios d'usage du relationnel et de nombreuses entreprises comptent encore dessus.
  2. Le deuxième segment, celui des bases de données non relationnelles de premier niveau, sera une part du secteur anciennement connu comme l'espace NoSQL. Dans ce segment, nous allons voir pas mal de vainqueurs passer sur le devant de la scène. De nombreux leaders ont déjà émergé (MongoDB, Redis, Cassandra...). Même si chacun de ces leaders dispose de son propre modèle natif de données, je crois qu'en plus, ils vont également tous proposer une fonctionnalité secondaire des autres modèles de données, ce qui va conduire à un certain chevauchement dans les cas d'usage et à une concurrence accrue sur ce segment.
  3. Le dernier segment sera celui des bases de données non relationnelles de deuxième niveau orientées sur des modèles de niche. Ces niches incluront les modèles dans lesquels les leaders n'auront pas eu le temps de s'investir - comme la géolocalisation, les bases de données de séries chronologiques et autres modèles de la même veine. Inévitablement, du fait de cas d'usage et d'offres de modèles plus limités, ces modèles auront un impact commercial moindre mais peuvent tout de même creuser un segment de valeur sur le marché.

Qu'en est-il des graphes ?

Voici donc la situation générale des bases de données - mais que se passe-t-il si l'on se penche sur les graphes ? A l'évidence, ayant créé Neo4j, je suis quelque peu subjectif sur ce modèle, cependant le marché a fait preuve d'une croissance massive indiscutable.

Quoique tous les concurrents se disputent la renommée dans l'espace NoSQL, nous avons constaté que la technologie des graphes prend la première place comme catégorie de bases de données à la plus forte croissance sur les trois dernières années (voir ci-après des chiffres de DB-Engines,com).


A mon avis, ce qui impulse cette croissance et cette réussite commerciale de la technologie de graphes est la conviction que les relations entre les données sont précieuses et traitées comme des éléments de premier ordre, à parts égales avec les données elles-mêmes. Ces relations sont essentielles. Au fur et à mesure que les entreprises deviennent plus avisées en termes de technologie, nous observons l'explosion de la valeur des données connectées.

Les plus grandes entreprises du monde cherchent à tout connecter - la chaîne d'approvisionnement, le CRM, la technologie marketing, la logistique, les clients, l'historique des paiements, etc. - ce qui accroît rapidement la valeur de ces relations.

Les entreprises du monde entier se rendent compte qu'en termes de données, une entreprise connectée est plus efficace - et rentable - qu'une entreprise déconnectée. Aujourd'hui, notre avancée est marquée par une croissance rapide mais je crois qu'en 2017 et dans les prochaines années, la technologie de graphes va devenir une norme d'entreprise pour toutes les sociétés du classement Fortune 500.