Bases de données de graphes et entreprise connectée : quel avenir ?

Pour bien aborder la transformation digitale, les entreprises doivent comprendre les différentes bases de données à leur disposition. Pour le moment, l'offre se répartit en trois catégories.

En ce début de nouvelle année, nous sommes nombreux à nous demander de quoi demain sera fait dans nos secteurs respectifs. Dans le secteur des bases de données en particulier, nous constatons un vif intérêt pour les bases de données NoSQL qui vont de solutions de niche aux plus généralisées et nous offrent un vaste choix à étudier. Tandis que les entreprises cherchent à réévaluer leurs business models (dont les bases de données qu'elles ont choisies) en 2017 et au-delà, elles sont incitées à ne pas perdre de vue que ceux qui n'innovent pas resteront à la traîne.

En réalité, les entreprises seront supplantées si elles ne mettent pas à jour leurs business models. Saviez-vous qu'en 1960, la durée de vie moyenne d'une entreprise du Standard & Poor’s 500 se situait autour de 65 ans? Aujourd'hui, selon les prévisions, d'ici 2027, 75% des entreprises S&P 500 seront supplantées. Réfléchissez-y une minute. On ne parle que de 10 ans !

La survie passe par l'innovation. Jusqu'en 2027 et au-delà, les entreprises qui réussiront à exploiter les données de leur organisation ont une plus grande chance de survivre. Le besoin des entreprises de traiter chaque client avec l'expérience la plus personnalisée et taillée sur mesure n'a jamais été aussi fort qu'à présent.

Dorénavant, l'information est connectée et synthétisée pour guider la prise de décision, l'orientation et l'interaction avec le client. C'est ce que l'on appelle l'entreprise connectée : un système de points de données entrecroisés qui fonctionnent ensemble dans une structure unique pour aider les entreprises à saisir une vision parmi les relations entre les données.

Afin de parvenir au statut d'entreprise connectée et de donner toute sa mesure à la portée des bases de données de graphes, les entreprises doivent comprendre les options de bases de données à leur disposition. Pour le moment, l'offre se répartit en trois catégories, comme je le précise ci-après.

Les bases de données relationnelles (SGBDR)

Ce n'est pas une révélation, mais il s'agit toujours de la technologie prédominante et qui a de grandes chances de le rester. D'innombrables entreprises et secteurs s'appuient sur les bases de données relationnelles et je ne vois pas cela changer prochainement.

Les bases de données NoSQL de Catégorie 1

Grâce au support des développeurs et à une réussite commerciale en continu, nous allons voir de nombreuses bases de données non relationnelles de Tier 1 émerger dans les rangs NoSQL. De plus, d'ici 2020, la croissance des bases de données open source va dépasser celle de leurs concurrentes de source propriétaire. D'ici là également, il est probable que la plupart des éditeurs NoSQL de Tier 1 disposeront de produits open source et de communautés très actives pour les soutenir. Il y aura probablement des chevauchements entre ces éditeurs qui offriront une fonctionnalité secondaire issue d'autres modèles de données ce qui, évidemment, va aiguiser la concurrence.

Les bases de données NoSQL de Catégorie 2

Les bases de données NoSQL secondaires, que je qualifierais de bases de données de Tier 2, se consacreront à des modèles de niche dont beaucoup n'ont pas eu le temps de se développer complètement. La plupart de ces bases de données concernent des cas d'usages et des modèles de commercialisation plus restreints, raison pour laquelle je prédis qu'elles auront un impact commercial moindre.

Alors, où les bases de données de graphes interviennent-elles ? Nous considérons les bases de données de graphes - en particulier celles offrant un stockage de graphes natif et un processus de requête - comme la nouvelle génération de bases de données relationnelles avec toutefois une prise en charge de première classe des "relations", c'est-à-dire ces connexions implicites indiquées par des clés externes dans le modèle relationnel. Par définition, une base de données de graphes native stocke les données sous forme de graphe et traite des requêtes qui renvoient les données et leurs relations en temps réel, ce qui en fait la base idéale pour faire des requêtes sur des données connectées. Elle modélise les données de manière directe et ergonomique façon 'tableau blanc' et permet aux utilisateurs de représenter la complexité des relations entre données de manière explicite, par rapport à une base de données relationnelle.

Les relations sont les éléments de premier ordre dans le modèle de bases de données de graphes, contrairement à d'autres systèmes de bases de données qui exigent de présumer des relations entre entités en utilisant des propriétés spéciales telles que des clés externes ou des traitements hors bande comme MapReduce. Chaque nœud dans le modèle de base de données de graphes contient directement et physiquement une liste d'enregistrements des relations qui représentent ses relations avec les autres nœuds.

Fondamentalement, les entreprises peuvent maintenir les données telles qu'elles se présentent dans la réalité : des entités à petite échelle, normalisées mais très connectées. Les utilisateurs peuvent ainsi requêter et visualiser les données en fonction de n'importe quel centre d'intérêt, ce qui vient en support de nombreux cas d'usage différents.

Pour les entreprises qui cherchent à se maintenir dans le quart supérieur du classement S&P 500, le facteur de réussite de plus en plus évident tient dans l'exploitation des données connectées. Les bases de données de graphes sont en mesure de fournir une vue complète et en temps réel des informations interconnectées, elles peuvent se dimensionner plus naturellement à de larges jeux de données et nécessiter des temps de requête plus courts, ce qui offre un avantage à quiconque veut soumettre un jeu de données à des requêtes complexes. En traitant les relations entre points de données comme des objets de premier ordre, une base de données de graphes est optimisée pour répondre à des questions sur ces relations. En fin de compte, une entreprise connectée qui s'appuie sur une base de données de graphes est plus rentable qu'une entreprise déconnectée et les entreprises qui le comprennent assez tôt vont prospérer dans les années qui viennent.