Comment TF1 collecte les données de ses millions d'utilisateurs
TF1, ce sont 25 millions de profils d'utilisateurs sur le digital logués et dédupliqués en base ainsi que 35,2 millions de streamers (en octobre sur les 4 écrans selon Médiamétrie). Des millions d'utilisateurs avec des préférences, des habitudes et des choix de consommation de contenus différents, soit autant de données que la chaîne doit pouvoir collecter, traiter et activer avec pertinence pour différentes finalités (analytics, personnalisation, publicité…).
La complexité à gérer ne vient pas que de la variété de données, de leur instantanéité et du nombre très significatif d'utilisateurs. Elle vient aussi de la variété de sources, formats et standards de traitement différents qui les génèrent. "Rien que pour TF1+ nous adressons 70 écrans différents", explique Hazedine Kez, responsable data analytics et data viz du groupe TF1. Par écrans, l'expert sous-entend chaque device, environnement, système d'exploitation et plateforme où TF1+ est accessible aujourd'hui, parmi le web, les applications mobiles, les box, les CTV, les applications des opérateurs, etc. "Chaque écran a ses propres spécificités techniques : il faut que je sois capable de m'y conformer afin de récupérer la donnée brute issue de toutes ces sources de manière ensuite à la normaliser et à la consolider dans notre 'réceptacle' sur le serveur, là où elle sera ensuite rendue disponible pour être activée à différentes fins, comme l'analyse d'audiences, la recommandation et la publicité de manière cohérente, sécurisée et fiable", poursuit-il.
Un travail de fourmi sur une masse considérable de données pour qualifier de la même manière une session ou une visite, un utilisateur unique, le décompte du temps de visionnage, le nom de la chaîne, etc. "Nous avons commencé à réfléchir à complètement changer notre manière de collecter les données en 2018. A l'époque, les différents sites et applications des marques du groupe disposaient de très nombreux tags de différents outils et solutions déployés par nos différents services. Le traitement de la donnée n'était pas harmonisé, n'obéissait pas aux mêmes critères. On observait des écarts considérables entre les données", résume Hazedine Kez.
Harmoniser la collecte
TF1 a commencé alors par déployer une solution de tag management (TMS) pour harmoniser la manière de collecter les données : Tag Commanders devenu depuis Commanders Act, une plateforme de gestion de données clients (CDP) made in France. Le processus d'implémentation du TMS a mis dix-huit mois. "Le véritable changement a été possible avec l'arrivée du server side à partir de 2021 . Cela a permis à TF1 d'enlever les tags des partenaires de ses pages pour centraliser la collecte de données dans un un serveur. La distribution des données à chacun des partenaires est maintenant l'apanage d'un serveur unique qui détermine en fonction de règles métier quel partenaire sera activé à l'instant T et qui contrôle l'envoi de la bonne donnée au bon format tout en s'assurant de sa bonne livraison. Cela a tout changé en matière de qualité de collecte de données mais aussi de transparence et de sécurité pour TF1", précise Stéphane Gendrel, directeur marketing de Commanders Act. De quoi améliorer la performance des pages tout en s'assurant de maîtriser les données sortantes.
Cette harmonisation passe aussi et surtout par la consolidation des identifiants des utilisateurs, à travers un graph ID, afin de dédupliquer les audiences et de s'assurer de détecter quand il s'agit du même utilisateur sur des devices différents. "Le graph ID est le socle centralisé des connaissances dont nous disposons au sujet de chacun de nos utilisateurs. Il est au service de tous nos usages –recommandation, relation client, publicité ; etc.", explique Hazedine Kez. Soit un méga outil CRM 3.0 dynamique qui concentre toute la segmentation dérivée de la connaissance client de chacun des 25 millions d'utilisateurs de la chaîne en base. "Le graph ID doit être très précis et agile car le comportement des utilisateurs change tout le temps et que les besoins d'activation se passent souvent en temps quasi réel. A l'instant T, il nous faut pouvoir changer un même utilisateur de segment en fonction de ses choix de consommation par exemple", explique Stéphane Gendrel. "Nous avons besoin de savoir qu'il s'agit d'un même utilisateur quel que soit le device dont il se sert pour se connecter à nos émissions et le graph ID nous sert à cela aussi", ajoute Hazedine Kez.
On pourrait imaginer que disposer d'un graph ID précis n'est pas très compliqué chez TF1, vu que pour consommer les contenus de la chaîne sur le digital il faut se loguer. Ce serait oublier qu'un même utilisateur se sert de plusieurs devices. Ce serait également et surtout oublier que sur les box opérateurs la consommation est analysée au niveau du foyer car il n'y a pas de login. Ce pourquoi le groupe pousse depuis quelques mois plusieurs solutions pour faciliter la reconnaissance de profils individuels même sur les box, parmi lesquelles "l'appairage", qui permet de répliquer sur la TV son profil sur le mobile via un simple QR Code. TF1+ propose également désormais aux utilisateurs la possibilité pour ces derniers de créer des profils différents au sein de TF1+ sur la TV, à l'instar de ce que propose Netflix depuis des années. Des efforts qui paient vu que parmi les 25 millions de logués, 3,8 millions le sont à travers leur écran TV selon TF1. En plus de la création de profil et de l'appairage, les modélisations algorithmiques aident à réconcilier les profils.
S'y ajoute aussi le challenge des pics d'audience. Avec tous ces flux d'information entrantes et sortantes, le système doit tenir même en cas d'une grande consommation à un instant T. "Quand tout à coup vous passez d'un million de personnes à plusieurs millions qui se connectent en même temps pour voir une finale de Coupe du Monde, il faut que derrière les serveurs continuent de répondre à la milliseconde avec la même qualité", ajoute Stéphane Gendrel. Une situation qui risque de se répéter de plus en plus souvent, TF1+ enregistrant mois après mois des records d'audience depuis son lancement en janvier.