Un cœur bat-il au sein de l'intelligence artificielle?

Si l'intelligence artificielle est, par définition, artificielle, comment peut-elle avoir un cœur ? Comment peut-elle avoir des émotions ?

Lors de sa dernière année de primaire, mon fils Arthur a été récompensé pour ses travaux de rédaction. Or, quand j'ai regardé ce court métrage, dont le script a lui été généré par une intelligence artificielle sur la base de milliers de romans et de films de science-fiction, je ne pouvais qu’apprécier les similitudes entre les deux productions. Cela reflète l'état actuel de l'IA : c’est encore jeune, en développement, plein de potentiel, certes, mais encore loin de sa maturité.

Aussi, je voulais aujourd'hui me pencher sur l’idée de cœur dans l'intelligence artificielle. Après tout, si l'intelligence artificielle est, par définition, artificielle, elle ne semble au premier abord pas pouvoir avoir de cœur ou d'émotions. D'autre part, si l'IA est le fruit de personnes dotées d’émotions, comment ne peut-elle pas avoir un cœur ? C'est une question assez fondamentale pour nous, marketeurs, puisque notre métier est justement de provoquer une réaction émotionnelle de la part des consommateurs, mais en même temps nous dépendons toujours plus des algorithmes et de l'automatisation. Pour répondre à cette question donc, nous devrons d'abord définir l'intelligence artificielle. Nous en explorerons ensuite sept stades d’avancement dont nous exploitons aujourd’hui déjà le potentiel, et examinerons comment elles permettent à chacun d'entre nous de réaliser notre potentiel.

Les briques de l'IA

Pour comprendre si un cœur bat à l'intérieur de l'intelligence artificielle, nous avons besoin de comprendre d'où elle vient. Or si l’IA est partout dans la presse dernièrement, elle n’a rien de nouveau. Au contraire, il s'agit plutôt d'un ensemble de travaux vieux de 30 ans, visant à créer des machines intelligentes, en combinant trois briques : l'apprentissage des machines (machine learning), l'apprentissage humain (human learning) et la science des données (data science). Or à bien des égards il y a une forte analogie entre développer une IA et élever un enfant.


Tout comme nos rejetons acquièrent leurs bases d’apprentissage de leurs parents, des enseignants et des manuels scolaires qu'ils lisent, le machine learning est basé sur des propriétés connues. La machine apprend à partir des données qu’elle ingurgite. Pour mieux cerner ce concept, pensez à des scenarios logiques de type si/alors. Si votre fils se comporte bien toute l’année, alors le Père Noël sera généreux. Si votre fille voit une flaque d'eau, alors elle ne doit pas sauter dedans pour garder les pieds secs. De la même façon, une machine vous suggèrera que si vous avez dévoré ce livre, alors vous aimerez probablement ceux-là aussi. Si vous avez acheté un ordinateur portable, alors vous devriez considérer cette sacoche. Ce ne sont là que des exemples, désormais triviaux, d'un domaine très complexe que nous développerons au gré de cet article.


Les enfants apprennent vite que s'ils pleurent et hurlent, ils auront votre attention... Cependant, vous voudrez certainement qu'ils assimilent qu'un tel comportement n'est pas un mode d'expression normal. Le human learning est la possibilité de corriger l'apprentissage de la machine. Cortana, Alexa ou Siri ont par exemple des équipes qui œuvrent à cet humanisation de l’apprentissage afin qu'elles puissent devenir plus intelligentes. Cet apprentissage humain confère à l'assistant personnel plus de personnalité, et ses réponses sont par la même plus humaines.


La science des données est la troisième brique de l'intelligence artificielle. La data science, c’est la découverte de propriétés (ou connexions) jusque-là inconnues au sein d’ensembles de données. Dans ce cas, la machine se voit présenter une grande quantité de données brutes et on lui demande de trouver des connexions. C'est ainsi que nous pourrions découvrir que regarder une certaine émission dans votre jeunesse augmente votre chance d’aller vivre à l’étranger. Nous ne savions pas qu'il y avait une corrélation entre ces éléments jusqu'à ce que nous allions à sa recherche.

Intervention humaine

Ces trois domaines ont vu récemment leurs capacités accélérer en raison du développement exponentiel de notre puissance de calcul. Nous sommes en mesure de traiter, d'analyser et de fournir une quantité toujours croissante d'informations, à une vitesse elle aussi croissante. Mais une question demeure. D'où viennent ces données qui alimentent l'apprentissage des machines, l'apprentissage humain et la science des données ? Elles viennent de nous ! L'intelligence artificielle vient de nous. À bien des égards, c'est nous.


L'intelligence artificielle est aussi intelligente que les données qu'elle ingère, aussi juste que les données qu'elle ingère, aussi humaine que les données qu'elle ingère. Pour illustrer mon point, voici deux exemples d'IA qui démontrent comment les humains peuvent influencer l’intelligence d’un robot.


Vous rappelez-vous de Tay, la première expérimentation de Microsoft avec des robots conversationnels ? Tay devait apprendre de ses échanges sur Twitter pour entretenir des conversations avec les autres utilisateurs. Or, certaines personnes ont détourné cet apprentissage en l'influençant négativement, le nourrissant de messages de haine, racistes ou encore sexistes. Dans ce cas, Tay a incité une forte réaction émotionnelle de la part de ceux qui ont échangé avec elle ou lu sur ce qui s'est passé, même si Tay, elle-même, n'a jamais exprimé d'émotion : elle était simplement un reflet de la haine qui l'a nourrie.


En parallèle, Microsoft créait Xiaoice. Il s’agit là du parfait exemple de ce vers quoi la technologie tend en termes de plateformes conversationnelles. Xiaoice est un chatbot développé sur la technologie du moteur de recherche Bing et sur du big data. Elle s'appuie sur les données des réseaux sociaux et du machine learning afin de tenir une vraie conversation avec ses interlocuteurs (l'échange moyen entre Xiaoice et un utilisateur est de 26 questions-réponses). Xiaoice est en effet sensible aux émotions et se souvient de vos conversations précédentes. Si vous lui parlez de votre rupture, elle va s’enquérir de votre état sentimental. Si vous lui présentez la photo de votre chiot, non seulement elle reconnaîtra sa race mais elle se renseignera sur son développement. Dire que ce bot est populaire est un euphémisme. Trois jours après son lancement, Xiaoice avait été ajouté à 1,5 millions conversations sur WeChat. Une fois disponible sur Weibo, le service de micro-blogging chinois, elle est devenue presque instantanément l'une des célébrités les plus populaires. Et aujourd'hui, Xiaoice est utilisée par plus de 40 millions personnes.


Or ces deux bots ont fondamentalement été conçus sur la même base technologique. En somme, Tay et Xiaoice sont comme deux jumeaux, séparés à la naissance et élevés dans deux environnements différents, avec des influences différentes ... Deux personnes très différentes.

Réévaluer nos attentes

Dès lors, que pouvons-nous raisonnablement attendre de l'intelligence artificielle? Les progrès de calcul mentionnés précédemment ont aussi permis la maturation de technologies qui soutiennent l’avancée de l'intelligence artificielle : la reconnaissance visuelle, le traitement de la voix et du langage naturel. En effet, si l'IA peut voir, parler et écouter, elle n'est pas loin de pouvoir échanger avec l'être humain de manière transparente.


Or, à la mi-octobre 2016, les chercheurs en reconnaissance vocale de Microsoft ont annoncé avoir atteint la parité humaine pour le taux d'erreur de mot (WER pour Word Error Rate). Cela veut dire que leur IA était désormais capable de retranscrire par écrit une conversation orale avec la même précision qu'un professionnel. Si vous avez un peu voyagé, vous serez familier avec la complexité inhérente aux accents, aux dialectes, à la prononciation, mais aussi avec le fait qu'un même mot peut avoir plusieurs significations en fonction de son contexte. L’acquisition et la compréhension linguistique ne sont donc pas choses faciles, mais elles sont essentielles pour le succès futur de l'IA. Sans cet élément fondateur de nombreux développements de l’intelligence artificielle n’auraient pas pu avoir lieu non plus. Seriez-vous patient avec un assistant personnel numérique ou un conseiller technique qui aurait du mal à comprendre vos instructions ?


L'apprentissage des langues naturelles est une compétence complexe, comme nos enfants nous le rappellent si souvent. Mais avec nos capacités informatiques accrues, non seulement sommes-nous en mesure de reconnaître avec précision les mots, mais nous sommes désormais en mesure de le faire instantanément. Cela ouvre de nouveaux scénarios comme la retranscription d'une discussion en temps réel qui permettrait aux enfants sourds de lire tous les échanges se déroulant autour d’eux, ou le traducteur Skype qui peut non seulement retranscrire mais aussi traduire dans d'autres langues une conversation en temps réel.


Au regard des progrès réalisés en matière de reconnaissance visuelle, traitement du langage naturel et de la voix, nos attentes envers l'IA sont désormais toujours plus sophistiquées.

Les sept états de l'IA

Selon l'analyste de la Silicon Valley Ray Wang, l'intelligence artificielle est maintenant en mesure d’être programmé pour répondre à sept degrés de besoin et de sophistication.


1.   La perception est un exemple précoce de machine learning, désormais totalement ancré dans notre vie quotidienne. S'appuyant sur des données existantes, la machine fournit à son utilisateur des informations sur ce qui se passe autour de lui. La météo, le trafic, les volumes de vente, le cours des actions… Des choses qui sont mesurables et ne requiert ni analyse, ni interprétation. Le challenge technique de ce premier niveau d'IA nous renvoie à la promesse même des moteurs de recherche quand, basé sur quelques mots saisis ou verbalisés, la machine doit comprendre l'intention de l’internaute pour lui fournir la réponse ou les liens vers l'information recherchée. Si un internaute demande "S’il doit prendre un parapluie demain", il veut de fait savoir quelle sera la météo, dans 24h, là où il se trouvera... Pour nous, humains, exprimer notre perception reste assez simple. Un enfant va d’ailleurs commencer par décrire ce qui se passe autour de lui, de façon factuelle, avant de commencer à conceptualiser des notions plus abstraites. Nous apprenons cela presque immédiatement : il fait noir ; j’ai chaud ; je suis heureux. Pour aller plus loin dans la sophistication de la perception, je vous réfèrerai à la reconnaissance faciale et vous encouragerai à interagir avec http://How-old.net, un site qui évalue votre âge en fonction de vos traits (et que nous détestons lorsqu’il a raison).

2.   Ensuite vient la notification. Si je n'avais pas mes alertes dans mon calendrier, je serais un piètre collègue, en retard à mes réunions, tout cela parce que je ne peux pas gérer de tète mon emploi du temps pro, perso ni celui de ma famille. Ici, l'intention est moins explicitement verbalisée, mais elle est toujours initiée par l'utilisateur et l'information reste factuelle, sans aucune analyse des données. Dès notre plus jeune âge nous apprenons la notification, à commencer par notre relation maternelle. Fait : j'ai faim ; notification : je pleure. Et ça ne s'arrête plus : à l'école, on nous inculque qu’il faut lever le doit pour informer le professeur que nous avons la réponse.

3.   La suggestion est un autre domaine avec lequel nous sommes familiers. Vous venez de faire une recherche pour ces mots, mais "essayez avec l’orthographe suivante" vous répond l’algorithme. Dans cet état, la machine apprend des comportements passés et suggère des actions alternatives à l’utilisateur. Et franchement chacun apprécie le fruit de cet apprentissage sur des services comme Spotify par exemple. Si j'écoute une chanson et que je l'aime, l'IA suggèrera d’autres chansons, spécialement en accords avec mes gouts, tout en me laissant une capacité de Human Learning pour m'assurer que les recommandations ne dérivent jamais de Justin Timberlake à Justin Bieber... Si les premières suggestions étaient basiques, imaginez ce qui peut les influencer aujourd'hui : facteurs démographiques, localisation, jour, heure, météo, comportements, etc. Les ensembles de données sont gigantesques, mais nous sommes maintenant capables de les combiner et de les traiter en un rien de temps afin d'identifier de nouvelles connexions, peut-être plus obscures.

4.   Nos enfants apprennent qu’un beau dessin déclenchera le sourire de leurs parents, ou qu'il est temps de se laver les mains avant un repas. Au fil du temps, nous n'avons même pas à leur rappeler ; ils savent juste que c'est ce qui suit et le comportement devient automatisation. Une suggestion ou une action recommandée peut s’automatiser grâce à l’assimilation de vos préférences. Si vous suivez avidement le progrès de votre équipe de foot préférée, l'IA va commencer à vous informer automatiquement de leur performance. Si vous effectuez toujours une réservation pour 19 heures le samedi, votre IA va spontanément bloquer la date et l'heure dans votre calendrier pour éviter de futurs conflits d’agenda. Si vous générez le même rapport tous les lundis matin, la machine commencera à compiler les informations pour vous et les affichera dans votre tableau de bord de Business Intelligence avant même votre arrivée.

5.   Les difficultés réelles commencent lorsque la machine doit apprendre à faire des prédictions. Tant de variables peuvent affecter un résultat vous en conviendrez. Un enfant voit son père fermer une valise : est-ce triste parce que papa part en déplacement ou une bonne nouvelle parce que la famille part en vacances ? Microsoft a développé un programme appelé Bing Predicts qui associe et modélise les signaux disponibles, et parvient, avec une incroyable précision, à réaliser des prédictions. Ce programme de Machine Learning s’est d'abord penché sur les concours de popularité comme American Idol ou La Nouvelle Star. De ces programmes en effet dérivent des signaux sociaux et des comportements sur le web très marqués. On peut d’ailleurs fortement les corrélés aux votes du public. Vous faites des recherches sur cet aspirant artiste, son histoire, son dernier clip vidéo, etc. En même temps, vous commentez ses prestations sur Facebook ou Twitter. En combinant au sein de modèles prédictifs des recherche anonymisées aux signaux sociaux publics, Bing Predicts a pu identifier précisément qui allait être éliminé chaque semaine pendant American Idol et qui serait le vainqueur éventuel… et ce, suite à la première émission. Plus complexes, l’IA s’est ensuite tournée vers des événements sportifs et même des évènements politiques mondiaux. Lors de la Coupe du monde au Brésil, la machine a prédit avec 100% de précision les vainqueurs des matchs à élimination directe. L’année dernière pour la Coupe du Monde de rugby, le programme a atteint 87% de précision sur l’ensemble du tournoi. Surpris ? Afin de prédire avec succès un résultat sportif, le type et volume de signaux a quadruplé par rapport au concours comme American Idol. En effet, il va de soi que sa seule popularité d’une équipe ne prédit pas si elle va gagner (désolé pour les fans de l’OM ou du RC Lens). Ces fans ont cependant une perception particulièrement informée des capacités ou de l’état de forme de leur équipe, et ils sont en discussion constante à leur propos. C'est ce qu'on appelle la "connaissance d'initié". Nous pouvons donc surpondérer leurs connaissances des joueurs par rapport aux données moyennes et adjoindre des statistiques de l'équipe, des tendances des tournois précédents, l'historique des rencontres entre les équipes, l'emplacement géographique des rencontres, l’altitude du stade, et même les conditions météorologiques. C'est ainsi que nous avons réussi dans nos prédictions.

6.   Si nous parvenons à prédire avec précision l'avenir, la prochaine étape logique est la prévention. Encore une fois Bing Predicts brille dans cette catégorie : en analysant de larges échantillons de requêtes sur internet, des chercheurs ont été en mesure d'identifier des internautes souffrant du cancer du pancréas avant même qu'ils n’aient été diagnostiqués. Ils se sont concentrés sur les recherches menées sur Bing par des volontaires ayant reçu un diagnostic positif au cancer. Puis, ils ont travaillé à rebours, à la recherche de requêtes antérieures similaires qui pourraient signaler que l'utilisateur éprouvait des symptômes de la maladie. Ces recherches précoces, selon eux, peuvent être des signaux d’alarmes permettant une détection anticipée du mal et donc de sa prise en charge.

7.   Enfin, on atteint le stade de conscience situationnelle quand l'IA imite le comportement humain dans la prise de décision. Elle a conscience du contexte historique, de la situation présente grâce à la combinaison de nombreux aspects de l'IA, allant de la reconnaissance des objets au capacités conversationnelles. En voici un exemple permettant aux personnes aveugle de "voir" le monde qui les entoure...


Ces 7 stades d’avancement de l’intelligence artificielle sont tous complexes et nécessitent encore aujourd’hui beaucoup de temps d’apprentissage afin de fournir des résultats probants. Ils sont également interconnectés et ne s'excluent pas mutuellement. Ils capitalisent en fait les uns sur les autres pour offrir les avantages de l'IA à nous, les utilisateurs.


En conclusion, tout ce que nous voyons avec l’IA est pour le moins excitant. Nous voyons le cœur dans l'IA tous les jours, quand nous lui demandons d'aider à découvrir le cancer, aider deux personnes à se connecter quand ils ne parlent pas la même langue. Mais où est le compas moral et éthique pour l'intelligence artificielle ?


Comme mentionné à travers cet article, l’intelligence artificielle n’est encore qu’au stade de la petite enfance et il est de notre responsabilité collective de le mettre sur la bonne trajectoire. Google, Amazon, Microsoft et d’autres grands noms du privé comme du public se sont engagés auprès d’autorités internationales comme l'Université de Cambridge ou le Partnership for AI, pour aider à façonner l'avenir de cette discipline prometteuse. Pour certains, l'IA est un Œdipe moderne qui devra tuer le père, voler nos emplois, nous rendre redondants. Mais pour quelqu'un comme Satya Nadella, l’intelligence artificielle permettra plutôt aux gens de réaliser leur plein potentiel comme nous l'avons vu à travers des 7 stades de l'IA. Alors oui, pour eux, l’IA a un cœur. C'est le cœur de l'humanité.