L'Europe doit se servir de l'intelligence artificielle pour repenser en profondeur les droits d'auteur

De 100 000 en 2001 à plus de 25 millions en 2023 : c'est l'évolution du nombre de fanfictions, des histoires écrites par des fans sur le thème de fictions populaires publiées sur internet.

De quoi faire mentir les chiffres de la baisse continue de la lecture et faire rêver les éditeurs. Le problème ? C’est illégal.

Partout ? Sur le papier, sans doute. Les lois de droits d’auteur diffèrent selon les pays, mais suivent de grands principes. Ils couvrent les créations, donnent des droits économiques et moraux pour un temps donné et sont automatiques.

Mais une distinction significative demeure : celle du « fair use ». Alors qu’aux Etats-Unis, ce concept autorise un usage raisonné des contenus, son absence en Europe rend ces exceptions limitées. Avec des effets parfois cocasses. Saviez-vous que prendre une photo de la tour Eiffel de jour est légal, mais pas de nuit ? En effet, l’exception panorama autorise les photos de bâtiment mais exclut les jeux de lumière dont le design est soumis au droit d’auteur.

En 2015, Google reportait 15 millions de plaintes liées au copyright par semaine. Une grande partie concernait du contenu piraté. Dans ces cas du piratage, le contenu était copié tel quel. Dans les autres cas, le contenu était transformé, parfois significativement. Mais dans le droit actuel, c’est sans importance : le créateur conserve tous les droits sur les œuvres dérivées. Même celles diffusées gratuitement par des fans pourtant sûrs de leur bon droit de « fair use ».

Sur ce terreau déjà fertile, l’intelligence artificielle pourrait bien être la révolution de trop

La capacité des modèles d’IA tels que ChatGPT à générer du langage vient de son entraînement : le contenu d’internet, en grande majorité sous copyright. C’est plus évident encore pour les modèles de génération d’images tels que Dall-E, qui s’inspirent explicitement du style d’artistes reconnus. Pour l’instant, les sociétés américaines sont protégées par le « fair use ».

Une chose est sûre : une machine ne peut pas détenir de copyright. Ainsi, la société OpenAI derrière ChatGPT ne peut pas protéger sa prose.

Les sociétés européennes sont forcées de recourir au blanchiment de données d’intelligence artificielle, une pratique qui consiste à faire la collecte par un institut de recherche, soumis aux exceptions, et à la commercialisation par une société privée. A l’heure où la compétitivité de l’intelligence artificielle Européenne est clé, ne devrait-on pas leur simplifier la vie ?

Une proposition récente de régulation européenne permettrait aux créateurs de refuser l’accès de l’IA à leurs contenus. Mais cette mesure va dans la mauvaise direction. Pour combler son retard, l’Europe doit avoir un cadre beaucoup plus libéral, similaire à la solution japonaise où les IA sont libres de s’entrainer sur tout.

Et l’Europe peut aller plus loin en repensant totalement son cadre afin de mettre fin à un système de rentes devenu fou.

Même avant l’IA, le copyright était déjà une rente devenue injustifiable à l’ère d’internet

Quelques exemples. La musique est devenue après l’introduction de la copie digitale à grande échelle un monde extrêmement complexe. Qui profite ? Une myriade d’intermédiaires nationaux inefficaces et attachés à leur opacité. Est-ce légal de chanter une reprise de chanson sur TikTok ? Oui – mais il faut l’accord de l’organisation qui gère les droits des chansons live. Qu’en est-il des copies digitales ? Une autre organisation s’en occupe car l’original d’une chanson relève d’un droit différent de sa reprise.

Les rentes liées au copyright sont comme les fanfictions : en forte croissance. En effet, les droits d’auteurs sont protégés quatre-vingt-quinze ans environ aux Etats-Unis et en Europe, contre vingt ans pour un brevet. Ce n’était pas le cas il y a un siècle – cette évolution est appelée « la courbe Mickey Mouse ». Grâce au lobbying de Disney, il vaut mieux être un média qu’une pharma !

Et sur internet, posséder de la donnée – notamment, la donnée utilisateurs – est clé. Mais souvent, elle est publique : les réseaux sociaux sont gratuits et libres d’accès. Pour empêcher les autres d’exploiter sa donnée, Meta s’est revendiqué à plusieurs reprises du copyright afin de bloquer le scrapping – l’accès à ses sites par des robots. Ce qui ne les a pas empêchés de plaider que leurs propres robots n’enfreignaient pas, eux, le copyright. Ils sont par ailleurs très friands du scrapping – sur les sites des autres, mais pour des raisons « non comparables ». On remercie les robots pour leur discernement.

Si l’Europe souhaite réguler la technologie pour favoriser l’innovation et mettre fin aux comportements anti-concurrentiels, elle devrait revoir son agenda en profondeur sur les droits d’auteur, sur l’IA et au-delà. Des droits raisonnables, plus limités en durée, incorporant un « fair use » renforcé.

Malheureusement, cela n’est pas au programme.