Comment les rédactions de l'éditeur suisse Tamedia se servent (beaucoup) de l'IA générative

Comment les rédactions de l'éditeur suisse Tamedia se servent (beaucoup) de l'IA générative De la retranscription d'interviews à la suggestion des titres en passant par la consultation des archives, les usages de l'IA générative se multiplient chez les 700 professionnels concernés.

Tamedia serait-il le groupe de presse le plus avancé en matière l'IA générative ?  L'entreprise suisse, qui édite 25 titres en français et en allemand, réunit au sein d'une tool box mise à disposition des 700 professionnels de ses rédactions toute une série d'outils et de fonctionnalités d'aide à la conception et à la production d'articles, dont certaines sont même intégrées au CMS du groupe.

Au cœur du réacteur, on retrouve quatre LLM (Claude, ChatGPT, Le Chat et Gemini), que Tamedia utilise via API et sur lesquels se basent de nombreuses fonctionnalités développées en interne, en plus d'une poignée d'outils du marché. Un développement rapide concentré sur toute l'année 2024 porté par l'AI Lab de Tamedia, créé en novembre 2023 pour permettre au groupe d'accélérer sur l'adoption de l'IA générative.

"Nous avons commencé à nous approprier ce sujet dès l'été 2022, bien avant la création du Lab et même avant le lancement de ChatGPT, en novembre 2022. Mais cette première phase a surtout été consacrée aux échanges en interne et à la définition d'un code de bonnes pratiques en la matière", explique Nadia Kohler, directrice de l'AI Lab de Tamedia, aujourd'hui doté d'une quinzaine de personnes.

La première mission du Lab a consisté à sensibiliser le personnel aux bénéfices et limites de cette nouvelle technologie, pour favoriser un usage "responsable et prudent" qui devait aussi passer par la mise en place de licences avec les principaux fournisseurs technologiques afin de sanctuariser les données du groupe. "Dans les contrats qui nous lient à chaque LLM auquel nos interfaces sont connectées, ces entreprises nous garantissent ne pas utiliser nos données à de fins d'entraînement de leurs modèles", explique Titus Plattner, journaliste, chef de projet senior interactif et développement chez Tamedia.

© Tamedia

De quoi permettre aux professionnels de faire appel aux IA pour retranscrire leurs entretiens (via notamment la technologie speech-to-text Happy Scribe), traduire leurs contenus d'un idiome à un autre, résumer des documents longs, générer des accroches pour la "une" des éditions imprimées, des posts pour les réseaux sociaux, des résumés pour les newsletters éditoriales et même consulter plus rapidement les archives du groupe.

4,5 millions d'articles vectorisés

Tamedia a en effet déjà vectorisé la production de ces quinze dernières années, soit 4,5 millions d'articles. L'information traitée selon le principe du RAG – génération augmentée de récupération – limite l'accès des LLM aux seuls documents pertinents pour la requête. Le journaliste interroge en langage naturel les archives, alimentées en temps réel, et reçoit en retour une sélection d'articles contenant les éléments de réponse.

Une fonctionnalité appelée à se développer vu que les équipes du Lab testent déjà la fourniture d'une réponse qui serait le résumé des articles pertinents avec les sources indiquées, un peu comme le fait un AI Overviews. De même, ils pourront bientôt élaborer des questions complexes, par exemple en demandant des comparaisons, des chronologies, etc.. Des usages à l'état de proof-of-concept (POC) actuellement.

Les fonctionnalités intégrées au CMS

A partir du CMS propriétaire du groupe, les journalistes de chez Tamedia accèdent à différentes fonctionnalités d'IA générative directement, parmi lesquelles :

  • La génération de titres, chapos et surtitres pour leurs articles : l'IA en propose trois versions ; le journaliste s'en inspire ou pas ;
  • La définition des points à retenir "en bref", généralement publiés à l'ouverture de l'article, juste après le chapo ;
  • La rédaction des résumés des "live" ;
  • La proposition des mots-clés les plus pertinents pour la création d'un titre SEO ;
  • La rédaction du text Alt, qui décrit l'objet d'une image.

Le CMS de Tamedia boosté à l'IA propose également un "SEO helper" qui fournit un score qui permet de vérifier si le texte répond correctement aux critères de référencement, tout en indiquant ce qui va ou ne va pas et pourquoi.

Pour l'ensemble des fonctionnalités mises à disposition, nos interlocuteurs ont mesuré que près de la moitié des 700 membres du personnel des rédactions en font déjà un usage au moins hebdomadaire. "A noter que l'auteur de l'article sera toujours responsable de son travail, d'où l'importance de systématiquement contrôler ce qui est proposé par l'IA et de garder le recul et l'esprit critique nécessaires", rappelle Nadia Kohler.

L'écriture augmentée : prochaine étape ?

Un esprit critique d'autant plus nécessaire que les cas d'usage sont appelés à se développer, comme le recours à l'IA pour une "écriture augmentée", possibilité qui commence à faire son chemin dans les réflexions.

L'AI Lab planche en effet en ce moment sur des fonctionnalités consistant à résumer ou à développer des paragraphes, voire des articles entiers. L'IA pourrait dans ce cas proposer des versions voire suggérer des améliorations au journaliste. "Une des complexités à l'industrialisation de ce procédé est de s'assurer que les modifications suggérées par l'IA soient correctement mises en exergue pour faciliter la comparaison et le contrôle par le journaliste", explique Titus Plattner, avant de préciser : "Les LLM évoluent à grande vitesse, notamment pour nous permettre d'envisager des usages d'écriture augmentée, mais nous n'en sommes pas encore là." Une autre piste à l'étude chez nos interlocuteurs est la proposition de résumés d'interviews générés par IA. Des tests en cours cherchent à en mesurer l'appétence auprès du lectorat.

Des tests sont par ailleurs en cours pour reformuler des annonces officielles à l'aide de l'IA dans le cadre de courtes brèves, sélectionnées et contrôlées par l'humain. Et pour des informations très pratiques, comme des condensés d'informations de trafic et de suggestions de loisirs, les LLM sont mobilisés pour améliorer la syntaxe des phrases, ce qui est indiqué aux lecteurs.

Pas d'IA générative pour les images et les vidéos

Tamedia n'envisage pas de recourir à l'IA générative pour la production d'images, encore moins de vidéos. "Notre charte précise que nous ne devons pas brouiller les pistes entre ce qui relève du réel et du virtuel synthétique. C'est pourquoi nous interdisons la publication d'images photo-réalistes générées par IA", précise Titus Plattner. Les illustrations générées par IA sont en revanche autorisées, à condition que ce soit indiqué explicitement dans le crédit photo le nom de la personne ayant prompté et l'IA avec laquelle l'image a été générée. "Mais nous nous en servons très peu à ce stade", précise-t-il.