Alain Levy (Weborama) "Nous lançons une offre de croisement de bases de données concurrente à Facebook et Google"

Le spécialiste des technos "big data" élargit son offre et permet dorénavant aux annonceurs de croiser leur base de données avec ses 500 millions d'ID, sans utiliser sa DMP. Un vrai pari.

JDN. Weborama permet désormais aux annonceurs de croiser leur base de données avec la sienne pour faire du "customer match" comme le proposent Google ou Facebook… et sans avoir besoin d'utiliser votre DMP. Pourquoi ce choix ?

Alain Levy (Weborama). Nous avons beaucoup misé au cours des dernières années dans le développement de technologies permettant aux annonceurs et éditeurs d'optimiser le traitement de leur donnée : outils de web analytics, de tracking,  d'adserving, DMP… Mais nous avons aussi investi historiquement dans la data science. Notre première base de données a vu le jour en 2002 ! Et nous l'avons toujours entretenue, convaincus que la data "third party", marché longtemps confidentiel, deviendrait un jour un vrai sujet. Cela nous a permis de construire la base de données la plus importante d'Europe avec 500 millions de "Webo ID" (une ID correspond ici à un internaute sur un device, ndlr). En France, nous avons 120 millions de "Webo ID".

Cette data est très puissante lorsqu'elle est couplée à notre DMP. Mais elle peut s'avérer tout aussi utile pour des annonceurs qui ne l'utilisent pas. C'est un gros enjeu commercial pour nous car nous adressons ainsi un marché bien plus important que celui de la DMP.

Vous avez lancé votre premier projet pilote de croisement de données en Espagne. Qu'est-ce que ça a donné ?

Nous avons effectivement testé le dispositif pour le compte d'Axa, dont l'enjeu était d'anticiper certains moments de vie de ses clients, pour pouvoir leur proposer des offres commerciales au moment où ils en ont besoin. Axa nous a communiqué une base incluant données CRM, informations remontées par les agents physiques et récoltées via la navigation sur ses sites. Un partenaire technologique a "onboardé" cette base avec notre base de données, via du matching de cookie ou à l'ID mobile.

Quel a été le taux de match, le pourcentage reconnu par ce partenaire ?

Ce taux dépend beaucoup de l'activité de notre client. Il est de 70 à 80% si le client a une activité online et donc beaucoup de données online. Il sera plutôt de 40 à 50% si l'essentiel de ses ventes passent par le offline. Cela reste dans tous les cas largement suffisant pour la création de nos modèles statistiques.

Une fois le matching effectué, qu'en faites-vous ?

On enrichit tout simplement la donnée client avec notre donnée. Nous avons ensuite procédé à un travail de data-mining et d'analyse qui a abouti à la création de 9 macro-segments, comme par exemple "jeunes femmes qui fondent leur foyer", "amoureux de voitures", "hommes responsables et actifs" et "personnes matures à la recherche d'un investissement" (ndlr, ce cas a été présenté lors des dernières rencontres de l'Udecam). Chaque Webo ID ne pouvait appartenir qu'à un seul segment.

"500 millions de Webo ID"

Nous diffusons ensuite cette segmentation à l'ensemble de notre base de données qui est composée de 80 millions de Webo ID en Espagne. Pour chaque segment, nous produisons un tableau de bord qui permet de décider s'il faut privilégier du branding ou de la performance et quelle marque du groupe il faut mettre en avant. Cela permet donc à l'annonceur d'effectuer des campagnes ciblées en fonction des attentes des internautes. Et, sans surprise, cela booste le taux de conversion.

Comment est vendue votre solution ?

De manière très classique, via une licence mensuelle pour accéder à la data "3d party" plus une licence "data analyse" si c'est Weborama qui opère le volet data science.

Le patron d'Artefact nous disait ne pas croire à la création de segments d'audience packagés comme le proposent beaucoup de régies mais à un enrichissement individu par individu. On imagine que vous êtes sur la même longueur d'onde…

Vendre des segments prépackagés de type "homme, 25-34 ans, intentionniste auto" dans lesquels on essaie de faire rentrer à tout prix des profils communiqués par l'annonceur, c'est clairement mettre la charrue avant les bœufs. D'autant que lorsque l'on est dans une telle logique, on est souvent tiraillé entre la volonté de faire des segments pointus, mais sans trop de volume, et des segments avec du volume, mais qui ne veulent plus trop rien dire.

Parlons de la DMP, les annonceurs semblent vraiment en revenir… Peinant à justifier les investissements très lourds consentis pour la développer.

Le problème est que beaucoup d'acteurs ont investi dans des technologies de DMP sans vraiment se poser la question de son utilité et se retrouvent aujourd'hui dans une situation où ils ont beaucoup de données mais ne savent tout simplement pas quoi en faire. Ce sont de véritables usines à gaz qui tournent en cercle fermé.

"Les appels d'offres DMP virent souvent au concours de beauté"

Ce manque de vision stratégique ressort dans certains appels d'offres qui virent au concours de beauté où on compare les différentes solutions, fonctionnalité par fonctionnalité. Des appels d'offres auxquels on ne participe plus ! La DMP est un outil qui n'a aucune utilité si on ne sait pas quels objectifs elle poursuit.

Votre offre de croisement des bases de données peut à ce titre jouer les rôles de porte d'entrée vers celle de votre DMP….

C'est juste. Je pense que c'est un moyen d'introduire de façon assez maligne des annonceurs à la problématique de la data. Ça leur permet, c'est certain, de construire des scénarios au sein desquels la data a une vraie utilité. Des scénarios qui peuvent gouverner le choix du partenaire DMP ensuite.   

Revenons à vos 500 millions de Webo ID. Comment avez-vous constitué cette base ?

La construction de ce pool de data s'est effectuée en deux temps. D'abord, en procédant à l'analyse sémantique des pages Web de nos sites partenaires. On analyse pour chacune d'elle la relation entre les mots, de façon à établir une taxonomie du Web français et près de 180 segments comportementaux.

On s'intéresse ensuite à l'internaute. On récupère les points de contact entre un internaute et le contenu. Cela nous permet de créer un nuage de mots pour chaque internaute, qui devient une Webo ID identifiée par un cookie ou un email. Chaque Webo ID se voit attribuée une note de 0 à 20 selon son affinité avec chacun des segments. Nous complétons enfin ces informations avec les profils socio-démo obtenus via des panels (âge, genre, catégorie socio-professionnelle). Des profils qu'on "projette" via le modèle du look-alike sur le reste de notre base. Nous détenons 180 segments comportementaux et 20 segments socio-démos.

Comment avez-vous convaincu ses éditeurs de vous laisser passer leurs pages au tamis ?

Cela se fait généralement via des partenariats où l'éditeur nous donne accès à son trafic et accède en échange aux informations que nous en extrayons. Cela peut aussi se faire via un partage de revenus sur la rémunération générée via la donnée brute que nous extrayons. Nous travaillons également avec des partenaires spécialisés dans la collecte et la revente de données.

Diplômé du MIT, Alain Levy fonde en 1999 l'incubateur Startup Avenue. Cet incubateur prend notamment une participation dans le site Weborama en 2000. Pendant deux années, de 2001 à 2003, il est consultant pour de grands groupes tels que Lagardère, Orange, Publicis ou TF1. En 2005, il devient actionnaire majoritaire de Weborama et modifie en profondeur le business model de ce spécialiste de l'analyse sur le Net. Un an plus tard, Weborama s'introduit en bourse. 

Et aussi :

Big Data / Base de données