Machine learning, ami ou ennemi de la médecine ?

Les intelligences artificielles basées sur des modèles de machine learning vont sans aucun doute être de plus en plus au service de la santé, mais peut-on réellement leur accorder une confiance aveugle ? Le point.

La crise sanitaire a fortement accéléré le développement de la technologie au sein de la médecine, notamment celle de l’intelligence artificielle. Il y a quelques mois, les chercheurs du MIT ont développé une IA capable de reconnaître les personnes atteintes de la Covid-19 grâce au son de leur toux. Le modèle a  été entraîné avec une base de données comprenant 70000 enregistrements venant de participants atteints ou non de la maladie. Le détecteur mis au point parvient à détecter 98,5% des cas, même lorsqu’il s’agit de cas asymptomatiques. 

Les intelligences artificielles basées sur des modèles de machine learning vont sans aucun doute être de plus en plus au service de la santé, mais peut-on réellement leur accorder une confiance aveugle ?

Le risque de biais

Un modèle de machine learning apprend des données qu’on lui fournit. Afin d’éviter d’obtenir des résultats biaisés, il est primordial de lui fournir des données les plus diversifiées possible. Pour illustrer avec un exemple, lors du développement d’une intelligence artificielle spécialisée dans la reconnaissance vocale, si les données fournies ne contiennent que des enregistrements de voix françaises adultes avec un accent neutre, l’IA ne sera pas capable de comprendre correctement des voix d’enfant ou avec accent. 

C’est le même principe qui s’applique pour la médecine, une trop forte représentation d’une catégorie d’individus, que ce soit l'âge ou l’origine géographique, peut introduire des biais dans les résultats du modèle.

Il est également très important de prendre en considération le contexte dans lequel ces données ont été collectées. Il peut arriver que pour certaines maladies, les données collectées proviennent de cas spécifiques jugés intéressants à étudier, mais par conséquence non-représentatifs des symptômes habituels. 

Comme le dit Taniya Mishra fondatrice et CEO de MySureStart, durant la conférence “Gender and Racial Bias in AI” données lors du CES 2021, “Aussi sophistiqué soit votre algorithme d'apprentissage, si les données ne sont pas au centre de vos préoccupations, vos résultats ne seront pas représentatifs.”

Autre difficulté à prendre en compte dans le domaine de la médecine, plus des ¾ des données sont stockées sous formes de texte. Il faut donc au préalable développer des outils permettant de fouiller et extraire les données pertinentes. 

La transparence remise en cause

Une des préoccupations majeures autour du modèle de machines learning dans la santé est le manque de transparence autour du fonctionnement d’apprentissage de l’algorithme.

Pour en savoir plus nous avons pu poser quelques questions à ce propos à Théophile du Portal, expert en machine learning et cofondateur de la start-up Finovox. 

Comment le machine learning est-il utilisé dans ton entreprise ?

"Chez Finovox, nous faisons de la détection de faux documents numériques. Le machine learning occupe une place dominante dans nos outils de détection."

Est-ce que tu comprends le fonctionnement d’apprentissage de ton modèle de machine learning ? Si non, est ce que tu penses que cela pose un problème de transparence ?

"Très bonne question, en effet les modèles de machine learning s’apparentent parfois à une boîte noire. Il existe des outils permettant de tenter de comprendre pourquoi un réseau de neurones a pris une décision, mais ceux-ci sont encore loin d’être parfaits. A titre personnel il m’est arrivé d’être surpris par l’efficacité de certains de nos modèles de réseaux neurones sans comprendre le raisonnement que celui-ci appliquait. En effet, la question de transparence mérite d'être posée pour certains domaines comme le médical ou les voitures autonomes. Je reste toutefois confiant quant aux risques associés à ce manque de transparence, car les réseaux de neurones actuels ne sont qu’une suite de modèles mathématiques et les humains prennent eux aussi souvent des décisions sans savoir réellement pourquoi. 

Dans la médecine afin de pouvoir communiquer en toute transparence avec un patient, il est nécessaire de comprendre et de pouvoir justifier une décision prise par l’intelligence artificielle. La question de la responsabilité se pose également. Qui sera responsable si l’une des décisions prise par l’IA s’avère erronée. Heureusement, les progrès avancent, et nous pouvons espérer que des outils fiables comprenant le raisonnement des ces modèles, voient le jour dans un futur proche."

Le machine learning prêt à remplacer les médecins ?

Comme nous l’avons vu auparavant, les modèles de machine learning se nourrissent de données collectées en amont. Lors de l’émergence d’un nouveau virus, aucune donnée n’est disponible au préalable, nous devons alors compter sur le corps médical pour les collecter. Ainsi, il faudra du temps avant que modèle de machine learning ait assez de données pour pouvoir apprendre et avoir des résultats fiables. Comme nous fait justement remarquer Théophile du Portal durant notre entretien “Le machine learning permet surtout de trouver des solutions innovantes à des problèmes observés”.

Il est primordial de mettre en place un contrôle de qualité rigoureux des données fournies à l'algorithme, tâche qui nécessite du personnel que l’IA n’est pas prête de remplacer.

On ne peut omettre d’évoquer les problèmes éthiques et de responsabilité qu’implique le remplacement complet des médecins par une IA. Le manque d’humain dans la médecine risque de produire chez les patients un manque de confiance ou encore de l’anxiété.

En ayant une confiance aveugle dans les prédictions, il y a danger de développer des situations que l’on appelle “prophétie autoréalisatrice”. Par exemple, le modèle a une interprétation erronée des données de diagnostic d’une maladie, et comprend que cette maladie est toujours fatale. Cette fausse interprétation va devenir vraie au fur et à mesure, car l’IA ne prescrira pas le traitement nécessaire pour cette maladie.

Même si tout n’est pas parfait et que de nombreux obstacles sont à surmonter, l’utilisation du machine learning dans la médecine fait et continue de faire beaucoup de progrès. En ayant un objectif coopératif entre l’IA et les médecins, celle-ci contribuera à l’amélioration des systèmes de santé. De la détection précoce de cancer, à des recommandations de traitement personnalisé, tout en passant par l'anticipation d’épidémies, les intelligences artificielles dans le domaine médical sont promises à un bel avenir.

Etienne De Bouet et Alexandre Bessis (Étudiants Mastères IIM - Institut de l’Internet et du Multimédia