Les graphes répondent aux besoins d’entreprises cherchant à explorer de vastes jeux de données

Les Panama Papers ont mis à jour le côté obscur des comptes offshore. Mais un autre aspect majeur notoire réside dans la puissance même des données et la façon dont celles-ci ont été passées au crible.

Les Panama Papers - cette fuite sans précédent de 11,5 millions de fichiers issus de la base de données du cabinet juridique mondial Mossack Fonseca - a révélé les comptes fiscaux offshore de clients fortunés, célèbres et puissants, mettant à nu la façon dont ils exploitaient des régimes fiscaux offshore et confidentiels.

À 2.6 pétaoctets de données, les Panama Papers représentent l'une des fuites les plus importantes de l'histoire qui dépasse de loin les messages diplomatiques américains publiés par Wikileaks en 2010 ou, plus récemment, les documents des renseignements remis à Edward Snowden.

L'investigation au cœur des transactions du cabinet juridique Panaméen et de sa clientèle d'élite a directement résulté du travail mené par des journalistes du Süddeutsche Zeitung et de l'ICIJ (International Consortium of Investigative Journalists).  L'envergure des données était telle que plus de 370 reporters de 80 pays y ont travaillé pendant un an. Dans le cadre de cette initiative, l'ICIJ a également  publié une base de données consultable de 300 000 entités que le Consortium a établi à partir des Panama Papers et de son investigation liée aux fuites offshore.

Ce qu'il faut retenir

Les Panama Papers ont mis à jour le côté obscur des comptes offshore et ont signalé des officiels gouvernementaux et publics haut placés qui ont été poussés vers la sortie. Mais un autre aspect majeur notoire réside dans la puissance même des données et la façon dont celles-ci ont été passées au crible. On peut être surpris qu'elles n'aient pas été explorées et manipulées par des experts de la donnée, mais par une équipe de journalistes dont beaucoup ne se considèrent pas comme des profils techniques.

Comment ces journalistes sont-ils parvenus à repérer des données parlantes parmi un nombre si colossal de fichiers non structurés ? La réponse se trouve dans la technologie des bases de données de graphes qui a permis aux journalistes de faire émerger les connexions entre les données. Mar Cabra, à la tête de l'unité de recherche des données à l'ICIJ, décrit la technologie des bases de données de graphes comme "un outil de découverte révolutionnaire qui a transformé notre processus de journalisme d'investigation".

Le talent unique des bases de données de graphes consiste à repérer les relations entre les données et de permettre de les comprendre à grande échelle. Les bases de données de graphes utilisent des structures composées de nœuds, de propriétés et de relations afin de stocker les données, contrairement aux bases de données relationnelles qui stockent les informations dans des tableaux figés. Ensuite, les bases de données de graphes cartographient les liaisons entre les entités requises.

Pour les journalistes d'investigation, c'est une aubaine, mais c'est aussi un outil puissant pour toute entreprise cherchant à s'atteler aux Big Data et aux enjeux des données connectées.

Les connexions de graphes surpassent les SGBDR

Les bases de données de graphes offrent la seule façon de donner réellement du sens avec efficacité aux téraoctets de données que nous observons à l'heure actuelle. Pourquoi ? Parce que, contrairement aux bases de données relationnelles qui scindent les données en tableaux, les bases de données de graphes utilisent une structure notionnelle qui calque la manière dont l'être humain regarde intuitivement l'information.

Une fois que le modèle de données est codé dans une architecture évolutive, une base de données de graphes est imbattable dans l'analyse de connexions au sein de vastes jeux de données complexes. Ceci permet à toute entreprise d'élaborer et de manipuler facilement de grandes structures de données.

Les géants technologiques comme Google, Facebook et LinkedIn ont compris la puissance des bases de données de graphes depuis un moment déjà. Par exemple, les outils de Google et Facebook nous permettant de naviguer dans nos réseaux sociaux grâce à une cartographie en temps réel des réseaux et des connexions se basent sur la technologie des graphes.  

Maintenant que la technologie des bases de données de graphes a commencé à se généraliser, l'analyse hautement évolutive des données connectées devient accessible à toute entreprise, des start-up aux entreprises cotées comme aux services publics.

Les graphes apportent de la flexibilité aux big data

Les bases de données de graphes sont vouées à se déployer avec l'Internet des Objets dans lequel des milliards d'objets connectés vont nous amener à faire face à des pétaoctets de données. Les bases de données de graphes vont permettre aux entreprises d'explorer ces données avec des moyens que ne permettent pas l'utilisation d'entrepôts de données et la technologie de bases de données relationnelles.

De plus en plus, la technologie des graphes devient l'outil de prédilection pour les institutions internationales, les gouvernements, les services financiers ainsi que pour les entreprises qui cherchent à établir des connexions en temps réel entre les données et à découvrir les schémas qui produisent ces relations.

Les entreprises prennent enfin conscience du fait que les bases de données de graphes offrent le seul outil capable de donner du sens aux connexions de données complexes qui ne tiennent pas dans des tableaux. La puissance des bases de données de graphes va sans aucun doute faire davantage parler d'elle dans le monde de l'entreprise car de plus en plus d'organisations s'emparent des capacités uniques qu'elle apporte.