Brian Myles (Le Devoir) "La réponse du COO d'OpenAI m'a sidérée"

Le directeur du quotidien québécois détaille sa stratégie pour protéger ses contenus "face à la spoliation de la propriété intellectuelle" par les éditeurs d'IA et pour renforcer sa relation directe avec son lectorat.

JDN. Le Devoir est un média de référence au Québec. Avez-vous été approché ou êtes-vous en discussion avec des plateformes d’IA pour négocier des accords de licence ?

Brian Myles, directeur du quotidien québécois Le Devoir. © Valérian Mazataud / Le Devoir

Brain Myles. Le Devoir, fondé en 1910, est de fait un média de référence dans le paysage québécois, sur édition imprimée (six par semaine) et numérique en continu. Nous avions lancé notre site internet en 1997 avec un mur payant dès notre tout premier jour en ligne. A l’époque, nous étions un peu à contre-courant, la plupart des médias approchant internet avec des contenus entièrement gratuits. Notre décision de protéger la valeur de nos contenus était stratégique. Nous n’avons jamais cru au paradigme de la gratuité des contenus, et encore moins désormais à l’ère de l’IA.

Quand ChatGPT a été déployé dans sa version grand public nous avons tout de suite compris l’enjeu. Très rapidement nous avons mis en place ce qu’il fallait pour bloquer l’accès à nos contenus à tous les robots qui viennent faire du scrapping pour les récupérer. Ce faisant, nous démontrons la valeur de notre propriété intellectuelle et nous la protégeons. Ceci dans le but d’établir une meilleure relation économique avec ces plateformes.

Nous avons discuté avec ces plateformes, notamment avec OpenAI, mais sans obtenir les résultats espérés. Cela a été le cas pour d’autres éditeurs de taille intermédiaire. OpenAI a préféré établir des accords avec El País (Prisa Media), Axel Springer, Le Monde et NewsCorp, soit des médias faisant autorité ou en position de leadership dans des marchés géographiques et linguistiques très circonscrits. OpenAI n’a pas du tout l’intention de négocier avec d’autres médias au-delà de ces acteurs. Le Québec est un petit marché.

Que faire face à cette impasse alors ?

Face à ce constat, ce que nous pouvons faire, c’est protéger notre propriété intellectuelle en bloquant du mieux que nous pouvons les crawlers des agents conversationnels, tout en sachant que le résultat reste très inégal. Parallèlement, nous investissons dans le renforcement de la relation directe avec nos utilisateurs. C’est le mieux à faire : conserver nous-mêmes les données primaires et la confiance que nos lecteurs nous accordent.

Nous tentons également de sensibiliser le gouvernement fédéral à la nécessité de faire évoluer la loi canadienne sur le droit d’auteur, encore insuffisante à ce stade pour nous protéger. Nos interlocuteurs nous déclarent vouloir attendre que les relations contractuelles avec ces IA évoluent. Faudra-t-il que les médias soient dans le fossé pour qu’une réaction face à la spoliation de la propriété intellectuelle par ces IA voit le jour ?

Tout est au point mort à vous entendre.

Non pas tout à fait : nous verrons peut-être émerger demain un marché programmatique du pay-per-crawl, comme nous avons aujourd’hui le marché programmatique de la publicité. Quelques entreprises s’y lancent, comme TollBit, qui veut se positionner comme une sorte de gardien du patrimoine et intermédiaire de la relation entre les producteurs de contenus et les robots. Nous étudions ces solutions parmi les trois proposées par TollBit, Fastly (Tollbit a annoncé un partenariat avec Fastly, solution de CDN, en juillet dernier, ndlr) et Cloudflare. Car ne nous y trompons pas : nous ne bloquons pas nos contenus pour les laisser inaccessibles mais bien pour établir une relation commerciale et être partie prenante de la chaîne de valeur créée sur l’IA. Ce modèle du pay-per-crawl est de plus sans doute plus viable pour les plateformes d’IA. C’est une bonne piste pouvant peut-être jeter les bases d’une source de revenus complémentaire pour les médias : les plateformes ayant besoin de nos contenus paieraient proportionnellement à l’usage. Et cela aurait surtout le mérite de stopper la spoliation pour laisser place à des relations commerciales consenties.

Pourquoi dites-vous que les résultats des outils servant à vous protéger contre le scrapping sont inégaux ?

Nous constatons qu’environ 200 robots viennent tenter de crawler nos contenus chaque jour. Nous nous protégeons avec Botscorner, qui est un bon outil, et nous avons une page robots.txt. Mais ces mesures sont insuffisantes vu que de nombreuses plateformes se servent de mécanismes de contournement pour continuer de crawler nos contenus malgré notre refus. De plus, aucun prestataire ne propose de solution globale. Botscorner, par exemple, ne nous permet pas pour le moment de mettre le pied dans le marché du pay-per-crawl. A voir si ce marché va vraiment se structurer et s’il s’avérera intéressant pour les médias.

"Le pay-per-crawl est une bonne piste desource de revenus complémentaire pour les médias"

Evidemment je fais la distinction entre ce qui a servi à l'entraînement des LLM et ce qui est utilisé par les moteurs de réponse. Dans le premier cas, nous ne sommes pas dupes, les entreprises d’IA ont déjà capturé toutes les données ouvertes qu’elles pouvaient capturer. Les contenus du Devoir représentent une goutte d’eau dans l’océan Pacifique dans ce cas. En revanche, pour ce qui est des événements récents et temps réel, ces IA, seules, ne sont pas capables d’apporter des réponses aux utilisateurs. ChatGPT ne sait pas me parler des résultats des élections ayant eu lieu la veille à Montréal par exemple. Pour le faire il doit crawler de nouvelles sources d’information, c’est-à-dire nos contenus et ceux de nos concurrents, afin de les intégrer à ses réponses.

Alors pourquoi la plupart de ces IA refusent-elles de reconnaître la valeur que vous leur apportez ?

J’ai demandé au COO d’OpenAI (Brad Lightcap, ndlr) quelle est sa vision sur leurs relations avec les médias. J’ai été sidéré de sa réponse. Il m’a répondu que le modèle est le même que celui développé par Google : les médias seront référencés chez ChatGPT et les utilisateurs y cliqueront pour aller vers leurs sites. Or, cela ne se produit pas comme cela : l’utilisateur ne sort pas de ChatGPT, le modèle du web click through est fortement challengé. La codépendance et la relation asymétrique et imparfaite que les médias ont encore avec les plateformes sociales et avec Google sont appelées à disparaître : à l’ère de l’IA, les médias sont purement et simplement écartés de la chaîne de valeur.

Si je devais laisser ChatGPT accéder aux contenus du Devoir j’aurais zéro dollar tandis que les utilisateurs de ChatGPT consulteraient des informations vérifiées et validées venant du Devoir. Si je devais dire à Google d’arrêter de se servir de mes contenus pour son agent conversationnel, je perdrais du jour au lendemain 50% de mon trafic sur le search, vu que Google lie le référencement SEO et le crawling pour son IA. C’est par conséquent un enjeu de reconnaissance de la propriété intellectuelle et de rééquilibrage de la chaîne de valeur de l’IA dont il est question.

Où en êtes-vous de votre rentabilité et modèle économique ?

Le Devoir est rentable depuis huit exercices financiers consécutifs. Nous le devons à une gestion prudente, à une stratégie de diversification de revenus et à des mesures de soutien gouvernemental de crédit d’impôt sur la masse salariale. En 25 ans, nous sommes passés de 100 à 180 employés environ. Nous sommes un journal payant : les deux tiers de nos revenus sont assurés par les abonnements et par des dons (nous sommes qualifiés à remettre des reçus donnant droit à des réductions d’impôts à nos donateurs). Nous avons entre 2,3 millions et 2,5 millions de visiteurs uniques par mois et en cumulant print et digital nous sommes à 1,2 million de lecteurs par semaine. Et ce malgré l’impact de la décision de Meta de couper l’accès aux médias canadiens à partir de ses plateformes (en vigueur depuis le 1er août 2023, ndlr).

Depuis cette décision de Meta, nous avons déployé une stratégie de renforcement de notre relation directe avec nos lecteurs en créant des parcours d’engagement et en proposant des tarifs très compétitifs. Fin 2024, nous avons réussi à augmenter le trafic direct de 20% à près de 30%, ce qui a compensé la baisse du trafic général. Nous avons également augmenté le nombre d’abonnés et les revenus issus de l’abonnement. Le Devoir compte aujourd’hui 35 000 abonnés numériques et environ 32 000 abonnés papier (la population du Québec, à 95% francophone, est d’environ 8,8 millions de personnes en 2023, ndlr). La publicité digitale compte pour entre 10% et 13% de nos revenus totaux. Nous aimerions mieux faire mais nous nous heurtons à la concurrence du duopole Google-Facebook. Sur le print, qui est en baisse progressive, la publicité reste forte, elle peut représenter entre 20% et 24% de nos revenus selon les années.