Comment les entreprises peuvent s’inspirer de Google pour comprendre le Big Data

R. Marsten, auteur ade plus de 30 articles sur l’optimisation informatique dans des publications académiques, écrivait en mars que la théorie des graphes joue un rôle essentiel dans la compréhension et l’exploitation optimale du Big Data.

Il observe que Google a ouvert la voie de l’analyse de graphe à l’ère moderne en utilisant les liens entre les documents sur le Web afin de saisir leur contexte sémantique. Il en est résulté un moteur de recherche qui a surclassé ses concurrents en place, au point de donner naissance au verbe « googler ». Bien entendu, nul n’ignore le parcours de Google depuis lors : son approche orientée graphe lui a permis d’innover à grande échelle et de dominer non seulement son cœur de marché– la recherche sur Internet – mais aussi l’ensemble du secteur de la gestion de l’information.

Des graphes pour tous

Cependant, les graphes ne sont pas réservés à ceux qui, comme Google et consorts, ont à leur disposition des capitaux quasi illimités et des armées de surdiplômés. Si Google et ses concurrents peuvent se permettre de bâtir leur propre infrastructure de données orientée graphe, nous avons nous aussi accès à cette technologie dans le commerce.
Par exemple, le projet Neo4j est une base de données open source, orientée graphe et arrivée à maturité, utilisée au sein de toutes sortes d’entreprises allant de sociétés Global 2000, tels Walmart, Lufthansa ou Cisco, à des start-ups innovantes comme FiftyThree, Medium ou CrunchBase. Les bases de données de graphes, à l’image de Neo4j, ont pris de l'importance ces derniers temps et, comme l’a récemment souligné l’analyste Matt Aslett du cabinet 451 Research, sortent de la catégorie générale «  non SQL » pour constituer une catégorie à part. Leur succès s’explique par le fait qu’à l’exemple de Roy Marsten, des milliers d’autres professionnels des logiciels et de l’information ont pris conscience que les graphes offrent la meilleure solution pour stocker et interroger leurs données interconnectées de plus en plus complexes.

Les graphes sont partout

La recherche sur le Web n’est pas le seul domaine où les entreprises peuvent tirer tout le bénéfice qu’offrent les graphes. Nous ne sommes pas sans savoir comment Facebook et Twitter se sont appuyés sur le graphe social pour dominer leurs marchés, ou encore comment Facebook et Google se servent désormais de leurs fonctions respectives GraphSearch (recherche dans le graphe) et Knowledge Graph (graphe de connaissances) pour préparer la nouvelle vague de recommandations hyper-ciblées et hyper-personnalisées. Toutefois les graphes sont aujourd’hui très largement employés dans un grand nombre d’autres secteurs.
Un exemple concret d’application des bases de données de graphes en dehors des moteurs de recherche nous est fourni par eBay qui – grâce à l’acquisition récente de Shutl – propose un service faisant appel aux graphes pour calculer rapidement les livraisons localisées de porte à porte entre acheteurs et vendeurs, étendant ainsi son activité à la chaîne logistique. Au passage, eBay a observé qu’avant l’adoption des graphes, le temps de latence pour sa recherche la plus longue dépassait le délai de livraison physique le plus court, de l’ordre de 15 minutes, ce qui n’est plus le cas aujourd’hui puisqu’une recherche effectuée via une base de données orientée graphe prend en moyenne 1/50ème de seconde !
Et ce n’est pas tout. Des entreprises grandes ou petites adoptent avec succès les graphes dans des domaines aussi divers que la distribution, la finance, les télécoms, l’informatique, les jeux, l’immobilier, la santé, la science, etc.

La puissance du Web dans son application

La puissance d’une base de données de graphes revient exactement à intégrer un mini-Web dans votre application. Vous explorez ce réseau de nœuds à travers des liens nommés et dirigés jusqu’à ce que vous trouviez ce que vous recherchez, qu’il s’agisse de l’emplacement de vos clés, d’un ami perdu de vue depuis l’université, des preuves de l’efficacité d’un essai clinique ou encore des autorisations d’accès à des systèmes informatiques (autant de problèmes de graphes, notons-le). La base de données de graphes a pour rôle de stocker ces données en toute sécurité et d’en accélérer et faciliter la recherche (l’un n’allant pas sans l’autre).
Pour prendre l’exemple des clés portées disparues, leur recherche à l’aide d’une base de données de graphes est à la fois rapide et facile. Il nous suffit d’écrire une requête Cypher décrivant visuellement la structure du graphe recherché (un modèle) puis de laisser la base de données trouver ce modèle parmi le réseau d’informations qu’elle recèle.
En l’occurrence, nous demandons à la base de données de rechercher des correspondances avec une personne nommée Alice qui détient des clés. Cependant, c’est plus particulièrement l’emplacement de ces clés qui nous intéresse. En représentant la structure du graphe (en « ASCII art » !), nous comblons l'écart cognitif entre l’utilisateur et le graphe de sorte que la recherche de données d’entreprise même densément interconnectées devient pratiquement un jeu d’enfant.
Aujourd’hui, de plus en plus d’entreprises et d’analystes dans le monde sont convaincus, tout comme Roy Marsten, que la création et l’analyse de graphes apportera à tous des réponses et que les liens qui s’établiront entre les données en feront ressortir tout le sens. Nous sommes, quant à nous, résolument persuadés que la capacité de compréhension des graphes par les entreprises est grandement renforcée par l’utilisation d’outils appropriés et nous nous réjouissons de la direction que prend la technologie des graphes.

Google / Big Data