Les graphes en pole position pour percer les réseaux criminels ?

Combiner les bases de données de graphes à un modèle de données par personne, objet, localisation et événement peut sérieusement aider les législateurs, et l’ensemble des services publics par la même occasion.

La technologie des bases de données de graphes est un puissant moyen d'identifier et d'exploiter les relations au sein de vastes quantités de données a priori désordonnées. Par exemple, le consortium international du journalisme d'investigation les a utilisées pour détecter la fraude et la corruption dans ses récentes enquêtes internationales sur les Panama et les Paradise Papers. Google a, de son côté, recourt à une représentation des connaissances à base de graphes pour renforcer son moteur de recherche et cartographier le web.

Les enjeux peuvent être divers - mieux contrôler une frontière, détecter une activité terroriste potentielle, repérer une fraude aux services sociaux ou aider à démanteler des escroqueries ou des attaques de hackers - les bases de données de graphes sont un outil puissant pour avoir une vue d'ensemble par l'analyse des relations. Grâce aux informations instructives qu'elle délivre sur les relations, la technologie des graphes peut aussi apporter un support à la police, aux services sociaux et autres services publics.

Il y a dix ans, la principale autorité en matière d'immigration d'un pays du G8 a commencé à travailler avec les bases de données de graphes pour mieux visualiser les relations et les connexions. Ce cas d'usage concernait essentiellement la gestion de dossiers, pour aider à travailler plus efficacement sur les cas individuels pouvant intéresser les agents des douanes.

Cette agence gouvernementale a découvert que les connexions délibérément cachées sont bien plus visibles quand on les examine avec un système conçu pour gérer les données connectées, ce qui fournit aux équipes un moyen de mener des enquêtes en temps réel pour percer divers réseaux criminels ou de fraude. Les bases de données de graphes sont également à l'étude pour aider à mettre en œuvre un nouveau système d'apprentissage informel très réactif en appui à la prise de décision, en incorporant des médias sociaux.

Tout revient à savoir qui connaît qui - la définition même d'une relation, à bien y réfléchir. Si une personne d'intérêt X s'est fait remarquer par les autorités pour une raison donnée, qui, dans le réseau de X, est-il intéressant de garder à l'œil ? Ces personnes sont peut-être en contact avec d'autres, elles-mêmes en relation avec des individus avec un casier judiciaire par exemple - un ancien délinquant qui peut retomber dans un schéma de mauvaises relations ou les membres d'une famille qui encourent potentiellement des problèmes ou sont en danger.

POLE position?

Les policiers explorent le tout en travaillant avec le modèle de données POLE (Personne, Objet, Localisation et Événement) sur les données criminelles. Le modèle POLE s'adapte très bien à la technologie des bases de données et aux algorithmes de graphes. Et cette affinité peut encore monter en force grâce à des interfaces de visualisation des données, avec des outils populaires comme Tableau. Une équipe a récemment testé cette hypothèse et est arrivée à des résultats très prometteurs. En utilisant un échantillon de données publiques sur la délinquance de rue pendant un mois sur la métropole de Manchester, les chercheurs ont interconnecté des données issues d'autres sources - données de géolocalisation, adresses, informations aléatoires sur des personnes - pour voir à quel niveau de détail il était possible d'obtenir une vue d'ensemble de ces relations. Un maillage intéressant de réseaux est vite apparu : il cartographiait 29 000 actes de délinquance à 15 000 endroits et avait généré 106 000 relations entre les nœuds.

Cet exemple et d'autres sur les graphes utiles aux services publics démontrent qu'un logiciel de bases de données de graphes et des données sur le crime peuvent aboutir à une combinaison vraiment puissante. Celle-ci peut appuyer les investigations et les décisions qui dépendent des données et permettre aux forces de police et aux autorités qui font appliquer la loi d'optimiser leurs ressources de façon intelligente dans un contexte de restriction budgétaire et de menaces criminelles et à la sécurité en perpétuelle évolution.

 

Annonces Google