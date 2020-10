Le géant de la publicité assure, chiffres à l'appui, que sa solution de ciblage par cohortes de centres d'intérêt est plus efficace que les méthodes basées sur les cookies.

Moins d'un mois après avoir présenté Dovekey, une solution qui permettrait aux annonceurs de concilier retargeting et respect de la vie privée, la division publicitaire de Google, Google Ads, ajoute une nouvelle contribution au projet Privacy Sandbox. C'est cette fois de la méthode Floc, pour Federated Learning of Cohorts, dont il est question. L'enjeu est de taille : permettre aux annonceurs de continuer à cibler les internautes selon leurs centres d'intérêt. Une pratique à mi-chemin entre l'awareness et les campagnes à la performance qui représentent une part importante des budgets médias. Pour y arriver, Google propose aux annonceurs de passer par des Floc, des segments d'audience que le navigateur Chrome établit en fonction des habitudes de navigation des utilisateurs. On passe d'une logique de ciblage one-to-one à un ciblage one-to-few (chaque segment étant composé de centaines, voire de milliers d'internautes) mais on ne perd pas en pertinence de ciblage si les choses sont bien faites, assure Google.

Deux variables pour établir les cohortes : les centres d'intérêt des utilisateurs et les conversions qu'ils ont effectuées

C'est sur les algorithmes qui permettront d'établir ces segments d'audience que le géant de la publicité lève aujourd'hui le voile via une note sur GitHub. Il s'agit de constituer des segments qui sont suffisamment volumineux pour empêcher toute identification individuelle par des tiers et suffisamment spécifiques pour intéresser les annonceurs. Un équilibre que Google entend préserver en croisant deux variables au moment d'établir ses cohortes : les centres d'intérêt des utilisateurs et les conversions qu'ils ont effectuées. Pour établir les premiers, Google propose de mapper le Web en assignant à chaque site jusqu'à cinq catégories représentatives de ses contenus et de les pondérer en fonction de leur importance. De sorte qu'un site généraliste comme Le Monde pourrait être catégorisé de la manière suivante : /News, News/General interest, News/General interest/Sport… Cela permettrait au navigateur de dresser un profil de l'utilisateur, en identifiant tous ses centres d'intérêt grâce aux catégories visitées, puis de l'inclure dans la cohorte qui correspond au top 10 de ses intérêts.

Ce n'est pas tout, Google Ads propose également d'analyser l'historique de conversions de l'utilisateur sur sept jours, pour identifier les environnements (mode, sport, automobile…) au sein desquels il en a effectué le plus. C'est ce mix entre centres d'intérêt et conversions passées qui permettrait au navigateur de prédire la probabilité qu'un utilisateur convertisse dans une thématique donnée… et de l'inclure dans la cohorte correspondante.

Plus 70% de précision dans les prédictions de conversion par rapport aux méthode cookies based

"Nous avons testé l'efficacité de nos algorithmes en les appliquant à nos propres jeux de données ainsi qu'à certaines bases de données publiques permettant d'identifier des centres d'intérêt", détaille Chetna Bindra, senior product manager chez Google, en charge de la confiance des utilisateurs, de la transparence et de la vie privée. Ces tests, assure notre interlocutrice, ont permis à Google d'isoler un incrément de performance par rapport aux méthodes cookies based : plus 70% en ce qui concerne les prédictions de conversion et plus 350% en ce qui concerne le taux de mémorisation du message publicitaire. Suffisant pour démontrer que "la méthode Floc est une bonne alternative aux cookies lorsqu'il s'agit de faire du ciblage selon les centres d'intérêt", estime Chetna Bindra.

Google Ads lance un appel à propositions

Si c'est, à en croire Chetna Bindra, "un vrai momentum dans l'histoire du projet Privacy Sandbox", ce n'est que le début. "Nous voulons que d'autres acteurs rebondissent sur cette proposition pour l'améliorer si besoin", déclare-t-elle. Il est vrai que certains points restent à éclaircir. Notamment le sujet de la nomenclature des segments d'audience. Faut-il laisser le soin à un organisme tiers de trancher sur une taxonomie standardisée ? "C'est une question qu'il faudra se poser", reconnait Chetna Bindra. Même flou concernant la taille minimale des cohortes. Chetna Bindra évoque des segments allant de "500 à 5 000 utilisateurs", tout en précisant que les planchers n'ont pas été tranchés. L'essentiel étant que les adtech ne puissent pas remonter à un utilisateur en particulier. A noter, par ailleurs, qu'un utilisateur ne pourra appartenir qu'à une seule cohorte à un instant T. Ce qui peut poser la question de la catégorisation de ceux qui ont des goûts plutôt éclectiques, même si une cohorte correspond à dix centre d'intérêt. L'algorithme de Google aura sans doute du mal à satisfaire les annonceurs de certaines niches.

C'est sans doute la raison pour laquelle les adtech sont encouragées à tester la solution de Google sur leurs propres jeux de données. De façon à identifier d'éventuelles carences. Les membres du W3C peuvent également plancher sur leurs propres algorithmes et les soumettre via GitHub, comme l'a fait Google. "La transparence et la collaboration sont importants dans un projet de cette ampleur", déclare Chetna Bindra. L'ouverture du géant de la publicité, généralement peu enclin à la jouer collectif, le démontre. Tout comme le fait que Google ait décidé de contacter, en amont de sa nouvelle publication GithHub, quelques journalistes pour leur expliquer sa démarche. Il témoigne de la volonté du groupe d'être plus audible sur un sujet où, passé les propositions de début janvier, on ne l'avait plus beaucoup entendu. "Le rendez-vous téléphonique que le W3C organise chaque semaine est indispensable à la bonne marche du projet. Il est important que la discussion se prolonge et que le plus grand nombre participe", conclut Chetna Bindra.