Demain l’IA saura générer un épisode de Game of Thrones en une seconde

Compte tenu des progrès de l’IA, il est probable que dans moins de 20 ans elle puisse générer à la demande des séries sur mesure du niveau de qualité de Game of Thrones, sans intervention humaine, et donc à un coût marginal nul.

Imaginez votre assistant personnel vous générer une série inédite de haute facture, à consommer sur un écran ou en réalité virtuelle, répondant à votre état émotionnel et besoins du moment. Si vous n’aimez pas la tournure que prennent les événements, si voir un des héros disparaître dans les flammes d’un dragon vous est trop difficile, l'IA le lira en direct sur votre visage, et vous proposera de générer instantanément un autre dénouement moins tragique. Science fiction ? Passons en revue les progrès techniques qui accréditent ce scénario !

L’IA sait déjà écrire des histoires
Des logiciels ont déjà écrit des romans (ayant failli de peu gagner des prix), des articles, des poèmes (publiés sur des sites de référence dont les éditeurs ont cru que seul un humain aurait pu les écrire). De simples requêtes dans votre moteur de recherche vous donneront des tonnes d’autres exemples sur ces thèmes !
La technique est toujours la même : nourrissez une IA avec assez d’exemples de romans, films, chansons, poèmes, et au bout d’un moment elle parvient à déceler les points communs, en somme ce qui constitue l’essence de ces œuvres, et parvient ensuite à les recombiner de façon de plus en plus sensée, avec la pointe d’originalité nécessaire pour nous intéresser. Bien sûr nous n’en sommes qu’aux balbutiements, mais les progrès vont aller en s’accélérant.Une IA a déjà par exemple écrit un script de film. Une autre au Japon a “créé” un film publicitaire.
L’IA Watson d’IBM sait maintenant générer presque toute seule une bande-annonce de film toute aussi alléchante que celle qu’auraient faite des spécialistes humains. En l’occurrence dans cet exemple un humain restait nécessaire pour certaines étapes, mais l’IA a fait passer le procédé de 30 jours à 24 heures ! Imaginez ce qui sera possible dans 10 ans, ou même 5 ans ?À la lueur de tous ces développements, il paraît donc hautement probable que d’ici à 20 ans, c’est-à-dire demain, l’IA puisse générer instantanément le script d’un épisode d’une série du type Game of Thrones, avec son cortège de didascalies.
L’IA sait aussi composer de la musique originale
Une IA par exemple a su composer de la musique classique inédite trompant les oreilles les plus expertes. Une autre a créé une nouvelle chanson des Beatles. Encore une fois, nous n’en sommes qu’aux débuts, mais il semble déjà possible de demander à une IA de générer instantanément une musique de film de qualité satisfaisante et collant à l’ambiance souhaitée.
L’IA sait déjà générer des images
Toujours avec la même recette, en nourrissant une IA avec des tonnes de photos, vidéos, sons, cette IA peut apprendre à reconnaître des formes récurrentes, des visages, des objets, des paysages. Première étape avant de pouvoir ensuite en générer de nouveaux, originaux, sur demande. Dites “dragon qui vole entre deux montagnes” et l’IA pourra bientôt générer une séquence inédite de la scène !
Par exemple, biberonné au lait de Street View, Google peut désormais générer des photos de paysages uniques qui trompent parfois les photographes avertisUne autre IA peut par exemple deviner ce qu’il va se passer sur une photo et en faire une vidéoRegardez aussi cet exemple de jeu vidéo récent qui montre les progrès accomplis en images de synthèse. Bientôt les scènes et paysages générés par une IA seront si criants de vérité qu’on ne saura dire s’il s’agit de la réalité ou non. Pourquoi alors se ruiner à “filmer” la réalité ?Google peut aussi “rêver”, c’est-à-dire générer des images inédites mêlant, déformant, amplifiant celles qu’il a digérées par ailleurs. Google sait aussi “recréer” en meilleure résolution la photo d'un visage à partir d'une première version très pixelisée avec une étonnante précision !
Google toujours, via son équipe Deepmind, peut maintenant générer des images inédites, presque de qualité photo, suite à une requête textuelle. Voyez-vous le lien avec la première partie de l’article et l’écriture de scripts de films ? L’IA permet déjà de faire dire, et bientôt faire faire à l’écran, ce qu’on veut à n’importe qui. Il est déjà quasiment possible de faire dire à quelqu’un n’importe quoi en vidéo. Regardez plutôt ces fausses vidéos d’Obama. Regardez aussi cette autre vidéo incroyable où des ingénieurs arrivent à “pirater” le visage d’Obama, Trump, Bush et Poutine et à leur faire faire toutes les mimiques qu’ils veulent. Il faut encore un acteur pour choisir les expressions à afficher sur le visage piraté, mais très bientôt une IA pourra faire ce travail selon son bon vouloir !
Avec assez d’enregistrements disponibles d’un individu en train de parler, une IA pourra comprendre ce qui fait l’essence de la voix et la reproduire à l’envi pour lui faire dire n’importe quoi, dans n’importe langue avec n’importe quel ton, accent, humeur, débit. Notre voix ne nous appartient plus, c’est un algorithme comme un autre. Écoutez cette IA reproduire la voix d’Obama juste sur la base de quelques minutes d’échantillon au départ !
L’IA peut aussi reproduire un avatar au réalisme photographique à couper le souffle, à faire figurer dans n’importe quel scène, et dont faire se mouvoir les lèvres selon son bon plaisir pour coller au texte qu’on veut lui faire dire.
Les applications en seront aussi fascinantes qu’inquiétantes. 
On pourra “ressusciter” une personne disparue (lire ma précédente tribune dans le JDN sur ce sujet), notamment un acteur. De Funès pourra aisément rejouer dans des films, son personnage haut en couleur, sa façon de jouer, ses mimiques faciales et gestuelles, tout cela sera décodé et utilisé pour animer un avatar photo-réaliste à qui faire faire et faire dire ce qu’on veut, dans le respect de son style.
Il existe déjà des applis grand public permettant se doter d’un avatar (rudimentaire) juste en faisant un seul selfie
Regardez aussi comment cette IA a “ressuscité” Joey de Friends pendant quelques secondes après avoir digéré et décodé ce qui fait Joey au travers de milliers de pages de scripts et de 236 épisodes.
L’IA saura faire le travail d’un réalisateur

Ok, admettons qu’une IA puisse écrire un script, générer les images voulues, mais quid de la façon unique qu’un réalisateur a de choisir un angle de vue, un plan et comment filmer une scène (à supposer que cela ne soit pas détaillé dans le script)?
Effectivement, cela semble être un morceau dur à avaler pour l’IA. Elle devra d’abord être éduquée et “voir” le plus de films possibles. Et les comprendre, au sens de saisir où se trouve quel objet, que fait quel personnage... En somme avec assez d’expérience, elle saura deviner où la caméra a été placée, quel est le niveau de zoom et d’éclairage, ainsi que toutes les autres subtilités techniques propres au monde du cinéma. 
Bientôt une IA saura déduire presque parfaitement tous les choix faits par le réalisateur derrière une séquence de film. Cela sera possible grâce aux immenses progrès en “visual recognition” (voir ce TED talk “Comment les ordis arrivent à reconnaître les objets instantanément” pour s’en convaincre). L’IA pourra apprendre à décrypter, et reproduire, les recettes des meilleures réalisateurs. L’IA pourra faire du Tarantino sur mesure, mais aussi hybrider les styles et même injecter une dose d’innovation, filmer une scène sous des angles inattendus.
Les exemples sont de plus en plus nombreux et convaincants avec le temps qui passe. Ils pointent tous vers le scénario que je brossais en début d’article. L’IA saura bientôt écrire un script de film de qualité. Et saura générer les scènes, images et son (paroles, musique, etc.), choisir les bons angles de vue nécessaires pour donner vie à ce script à l’écran, ou sur le prochain medium de choix, mêlant sans doute réalité virtuelle, augmentée.
Les logiciels pour y arriver restent à écrire, perfectionner et combiner. Et les ordinateurs doivent encore devenir plus puissants pour traiter concomitamment tous les calculs astronomiques requis. Mais rien ne devrait entraver cette marche. 
Tôt ou tard, d’ici à 20 ans tout au plus selon toute vraisemblance, une série de la qualité de Game of Thrones devrait pouvoir être générée en un instant, sur demande, et sur mesure. Avec possibilité de rectifier le tir en cours de route, de demander une fin alternative, ou deux, ou trois, ou une infinité d’épisodes. Plus qu’on n’aura de temps pour les regarder, sauf si nous devenons immortels entre temps comme certains allumés de la Silicon Valley l’envisagent…

Innovation / Réalité virtuelle