Intelligence artificielle et technologie des graphes : améliorer l'IA grâce au contexte et aux connexions

La technologie des graphes, en reliant les données et en définissant les relations, apporte à l’intelligence artificielle des éléments de contexte précis, permettant de favoriser efficacement le développement d’applications d’IA sophistiquées.

L'idée de l'intelligence artificielle (IA) a une longue histoire puisqu’on en retrouve déjà des prémices dans les années 1940-1945. L'intelligence artificielle est une solution ou un ensemble d'outils permettant de résoudre des problèmes en se basant sur le modèle de l'intelligence humaine. Habituellement, son but le plus pratique est de faire des prédictions - soit en classant des choses (comme l'ajout d'une étiquette) ou en prédisant une valeur (comme le prochain chiffre attendu dans une série).

Dans un sens plus large, l'IA est catégorisée comme étant soit étroite, soit générale. L'IA étroite est axée sur l'exécution d'une seule tâche, comme la reconnaissance d'images. L'IA plus générale comprend de multiples capacités en matière de planification, de compréhension du langage, de reconnaissance d'objets, d'apprentissage ou de résolution de problèmes. Aujourd'hui, les solutions d'IA appartiennent pour la plupart à la catégorie étroite de l'IA, mais elles sont de plus en plus largement applicables à des situations nouvelles et donc de plus en plus puissantes avec le temps.

La technologie des graphes, elle, relie les données et définit leurs relations ce qui donne un cadre à celles-ci. En améliorant l'intelligence artificielle dans un contexte connexe, la technologie des graphes offre un moyen efficace pour favoriser le développement d'applications d'intelligence artificielle sophistiquées.

Un nom générique pour 2 sous-ensembles : l’Intelligence artificielle

Il existe trois grandes appellations pour qualifier les technologies d'IA qui résolvent chacune les problèmes de façon différente. L'intelligence artificielle est un terme générique qui inclut le sous-ensemble de l'apprentissage machine (machine learning) et de l'apprentissage profond (deep learning).

L'IA est un processus informatique qui a appris à accomplir des tâches d'une manière qui imite les décisions humaines. Notez que cela n'exige pas qu'il y ait de véritables renseignements. Cependant, elle laisse la porte ouverte à de nombreuses façons d'accomplir des tâches caractéristiques de l'intelligence humaine.

On peut ainsi dire que dans un projet d’intelligence artificielle, le terme d’IA est l'objectif de la solution recherchée, et l'apprentissage machine est essentiellement une méthode pour y parvenir.

L'apprentissage machine utilise des algorithmes pour apprendre par des exemples spécifiques et des améliorations progressives, sans programmation explicite. La "formation" d'une IA consiste à fournir beaucoup de données à un algorithme pour lui permettre d'apprendre à traiter cette information. La partie "apprentissage" du machine learning signifie que les algorithmes reproduisent plusieurs fois une action afin d’optimiser une fonction objective, comme la réduction des erreurs ou des pertes. L'apprentissage machine est dynamique, avec la possibilité de se modifier lorsqu'on lui présente plus de données.
L'apprentissage profond est un sous-ensemble de l'apprentissage machine qui utilise plusieurs couches pour cascader l'apprentissage et travailler avec des abstractions hiérarchiques. La partie "profonde" de l'apprentissage profond fait référence à de multiples couches cachées d'abstraction. Ces couches permettent des hiérarchies de caractéristiques telles que l'ajout de la forme, de la taille et de l'odeur à une catégorie de fruits.

Puisque l'intelligence artificielle vise à faire des choix de la même façon que les gens, elle doit examiner la catégorie d'information la plus importante dont les gens se servent pour prendre des décisions : le contexte.

Ainsi, une façon de rendre les applications d'IA plus largement utilisables est de leur fournir le contexte, en les entourant d'informations connexes à utiliser pour résoudre le problème en question.

L’intelligence artificielle ne peut être efficace que grâce à un contexte défini et pertinent…

Le contexte est crucial pour la prise de décision, aussi bien pour les humains que pour l'intelligence artificielle. Les adultes prennent des dizaines de milliers de décisions chaque jour (certains disent environ 35 000), et la plupart dépendent des circonstances ou des perspectives qui nous entourent.

Les humains utilisent l'apprentissage contextuel pour déterminer ce qui est important dans une situation et comment l’appliquer à de nouvelles situations. Pour que l'intelligence artificielle puisse prendre des décisions au plus proche de l’intelligence humaine, il lui faut intégrer beaucoup de contexte. Sans information périphérique et connexe, l'IA exige une formation plus exhaustive, des règles plus prescriptives et des applications plus spécifiques.

Contexte qui est clairement défini par les graphes à 4 voies.

Il y a au moins quatre domaines principaux où les graphes fournissent du contexte à l'IA :

Tout d'abord les graphes de connaissances, qui fournissent un contexte pour l'aide à la décision et aident à s'assurer que les réponses sont appropriées à la situation.
Ensuite, les graphes offrent une plus grande efficacité de traitement et, par conséquent, l'apprentissage automatique s’en trouve accéléré dans la mesure où les graphes optimisent les modèles et accélèrent ainsi les processus.
Troisièmement, l'extraction d'entités connectées analyse les données pour identifier les éléments les plus prédictifs des données. Baser un modèle prédictif sur des caractéristiques fortes trouvées dans les données améliore la précision.
Enfin, les graphes offrent un moyen d'assurer la transparence dans la façon dont l'IA prend ses décisions. C'est ce qu'on appelle l'explicabilité de l'intelligence artificielle.

Pour un meilleur contexte de décision : les graphes de connaissances

L'aide à la décision est l'un des domaines de l'intelligence artificielle qui est entré en production le plus rapidement. Supposons que nous essayons de résoudre un problème du monde réel : prendre une décision qui exige qu'un être humain dispose des bonnes informations contextuelles et pertinentes et que nous essayons d'automatiser ou de rationaliser ce processus d'une certaine manière.

Les graphes de connaissances offrent un moyen de rationaliser les flux de travail, d'automatiser les réponses, d'améliorer la productivité et de prendre des décisions intelligentes à grande échelle. Par ailleurs, les graphes de connaissances sont des ensembles de faits interdépendants qui décrivent des entités, des faits ou des choses du monde réel et leurs interrelations sous une forme compréhensible pour l'homme.

Contrairement à une simple base de connaissances avec des structures plates et un contenu statique, un graphe de connaissances acquiert et intègre des informations adjacentes en utilisant des relations de données pour obtenir de nouvelles connaissances.

Il existe aujourd'hui sur le marché trois catégories principales de graphes de connaissances : les graphes contextuels, les graphes à détection externe et les graphes de traitement du langage naturel (Natural Language Processing).

Le graphe contextuel tient compte du fait que la simple recherche par mot-clé ou l'identification de l'importance d'un seul mot ne fonctionne pas bien pour un grand corpus de connaissances hétérogènes. Un graphe de connaissances nous permet d'incorporer le contexte de documents et de fichiers internes avec le balisage des métadonnées. En reliant ces informations dans un graphe, nous pouvons parcourir ces connaissances beaucoup plus rapidement.
Un graphe à détection externe agrège, quant à lui, les sources de données externes et les met en correspondance avec les entités internes d'intérêt. Par exemple, pour évaluer le risque de la chaîne d'approvisionnement, nous pourrions vouloir examiner tous nos fournisseurs, tous les endroits où ils fabriquent et toutes les lignes d'approvisionnement pour analyser le risque de perturbation. Il est alors possible d'examiner comment une catastrophe naturelle sur un site spécifique pourrait avoir un impact sur la chaîne d'approvisionnement globale et d'identifier des fournisseurs similaires sur des sites différents.
En ce qui concerne les graphes de traitement du langage naturel (NLP), ils intègrent la complexité et les nuances du langage humain. Ils exigent la compréhension des termes techniques spécifiques d'une entreprise, des noms de produits, des acronymes de l'industrie, des numéros de pièces et même des fautes d'orthographe courantes. C'est là que les analystes créent un graphe de connaissances pour cartographier le sens et construire une ontologie, ce qui à son tour améliore la recherche et fournit des résultats plus pertinents.

La plupart des implémentations d'applications d'IA utilisant des graphes aujourd'hui s'appuient sur les graphes de connaissance.

Toutefois, il existe de nombreux autres domaines où la technologie des graphes est prometteuse pour les applications d'IA.

Pour un meilleur contexte de l’efficience : l’apprentissage machine accéléré par graphe

Les méthodes actuelles d'apprentissage machine reposent souvent sur des données stockées dans des tableaux. L'apprentissage machine sur de telles données exige, au mieux, beaucoup de ressources. Selon une étude menée par le cabinet Thomson Reuters fin 2018, plus de la moitié des DSI d'entreprise interrogés déclarent que la formation sur les modèles itératifs est l'un de leurs plus grands défis pour faire passer les projets d'IA du concept à la production.

Les graphes fournissent un contexte pour améliorer l'efficacité des algorithmes d'apprentissage machine parce que les données sont déjà connectées de par le modèle graphe, ce qui permet de parcourir et d'analyser rapidement à l'échelle les relations de nombreux degrés de séparation. D'où le nom d'apprentissage machine accéléré par graphe.

L'échelle est un autre problème dans l'efficacité de l'apprentissage machine. Les algorithmes d'apprentissage peuvent exécuter un calcul à partir de toutes les données. Pour éviter cela, les analystes peuvent créer manuellement des sous-ensembles de données. Ces approches ont tendance à ralentir les itérations parce qu'elles exigent beaucoup de calculs ou qu'elles nécessitent une intervention humaine. Une simple requête graphe accélère ce processus en renvoyant un sous-graphe ne contenant que les données nécessaires.

À l'aide de graphes, nous extrayons rapidement les caractéristiques prédictives et remodelons les données pour qu'elles soient utilisables dans un pipeline d'apprentissage machine.

Pour un meilleur contexte de l’exactitude : les caractéristiques connectées

Les relations sont souvent les indicateurs de prédiction les plus forts du comportement.

Les caractéristiques connectées sont des métriques liées à la connexion de notre graphe, telles que le nombre de relations entrant ou sortant des nœuds, un nombre de triangles potentiels ou de voisins en commun.

Les méthodes actuelles d'apprentissage machine s'appuient généralement sur des données d'entrée construites à partir de tableaux. Cela signifie souvent qu'il faut essayer d'abstraire, de simplifier et - parfois - d'omettre complètement un grand nombre de relations prédictives et de données contextuelles. Avec les données et les relations connectées stockées sous forme de graphes, il est facile d'extraire les caractéristiques connectées et d'incorporer plus facilement toutes ces informations importantes.

Cependant, nous pourrions utiliser des algorithmes de graphes pour trouver des caractéristiques où nous connaissons la structure générale que nous recherchons mais pas le modèle exact. Par exemple, les algorithmes de graphes simplifient la recherche d'anomalies dans les communautés qui peuvent être des réseaux de fraude ou de blanchiment d'argent. Nous pourrions alors marquer des nœuds dans notre communauté étroitement liée et extraire cette information pour la formation d'un modèle d'apprentissage machine.

L'utilisation de fonctions connectées optimise la puissance prédictive de notre modèle tout en augmentant l'étendue de l'application de la solution.

Pour un meilleur contexte de la crédibilité : l’explicabilité de l'IA

L'un des défis de l'adoption de l'IA consiste à comprendre comment une solution d'IA a pris une décision particulière. Le domaine de l'explicabilité de l'IA n'en est qu'à ses débuts, mais de nombreuses recherches suggèrent que les graphes facilitent la traçabilité et l'explication des prédictions de l'IA.

Cette capacité est cruciale pour l'adoption à long terme de l'IA parce que, dans de nombreux secteurs, comme les soins de santé, l'évaluation du risque de crédit et la justice pénale, nous devons être capables d'expliquer comment et pourquoi les décisions sont prises par l'IA. C'est là que les graphes peuvent ajouter un contexte à la crédibilité.

Il y a trois catégories d'explicabilité qui se rapportent au type de questions que nous posons :

Des données explicables signifient que nous savons quelles données ont été utilisées pour former notre modèle et pourquoi. Malheureusement, ce n'est pas aussi simple qu'on pourrait le croire. Si nous considérons un grand fournisseur de services dans le Cloud ou une entreprise de type GAFA avec une énorme quantité de données, il est difficile de savoir quelles données exactes ont été utilisées pour informer ses algorithmes.
Les graphes abordent assez facilement la question des données explicables, en utilisant les méthodes de lignage de données employées par la plupart des principales institutions financières d'aujourd'hui. Pour ce faire, nous devons stocker nos données sous forme de graphe, mais nous avons la possibilité de suivre comment les données sont modifiées, où les données sont utilisées et qui a utilisé quelles données.
Enfin, des algorithmes explicables nous permettent de comprendre quelles couches et quels seuils conduisent à une prédiction.

Conclusion

En conclusion, l'IA et l'apprentissage machine ont un grand potentiel. Les graphes libèrent ce potentiel. C'est ainsi que l’on peut dire que la technologie de graphe, parce qu’elle intègre le contexte et les connexions, rend l'IA plus largement applicable et la fait entrer dans une nouvelle ère.