Comment se parlent CRM, DMP et datalake ?

Où stocker les données collectées ? Zoom sur les interactions entre CRM, DMP et Datalake.

Où et comment stocker les multiples données collectées par un annonceur ? A minima, les données personnelles des clients de l’annonceur le seront dans une base CRM 360 ou RCU. Les données anonymes sont plutôt destinées à être déversées dans une DMP. Enfin, CRM 360 et DMP peuvent venir alimenter un datalake pour réaliser des analyses plus poussées (scoring, segmentation…).

Un CRM 360 pour stocker les données personnelles

Un CRM 360 a pour vocation de stocker les données personnelles de vos clients ou prospects. Il s’agit donc de données souvent très structurées (résultant de la soumission d’un formulaire par exemple) avec un nombre réduit d’identifiants uniques, à savoir l’email ou le numéro de téléphone. Les volumes de données sont souvent “raisonnables”, à savoir quelques millions de lignes pour les plus gros opérateurs. Le volume de données croît de manière linéaire. Une base de données en Sql (Structured Query Language) est dans la plupart des cas parfaitement adaptée pour cet usage.

Le CRM 360 peut aussi être désigné par le terme de RCU (Référentiel Client Unique). Il peut être intégré directement à l’outil de marketing 360 (Selligent, Splio, ExactTarget, Adobe, Oracle…) ou hébergé sur des serveurs distincts (Camps de base, ETO…). Dans ce dernier cas, l’outil de marketing 360 viendra se brancher sur le RCU. Les annonceurs ayant des sources de données multiples peuvent privilégier une telle architecture afin de s’assurer d’une bonne qualité de données (les prestataires cités réalisant souvent un gros travail sur le DQM, Data Quality Management). Un autre bénéfice recherché peut-être l’optimisation du temps de calcul des requêtes.

La plupart des annonceurs disposent aujourd’hui d’un CRM 360, souvent à travers leur base CRM. Ils sont moins nombreux à s’être équipés du prochain outil que nous présentons, à savoir la DMP.

Une DMP pour stocker les données anonymes

Une DMP (Data Management Platform) est l’outil idéal pour stocker les données anonymes, qui sont essentiellement des données média (impression, clic sur des publicités) mais qui peuvent aussi être des données de navigation (utilisateurs non loggés, navigation sur un partenaire 2nd party…). Cette donnée est aussi relativement structurée mais les volumes à traiter sont gigantesques. À titre d’exemple, une grosse campagne display génère des volumes de l’ordre du milliard d’impressions sur un mois. C’est pourquoi les DMPs peuvent s’appuyer sur des architecture de type big data avec des clusters basés sur Hadoop ou Spark pour pouvoir ingérer facilement ces énormes volumes de données. Les identifiants sont souvent multiples, entre les cookies des différents navigateurs sur lequel navigue un internaute (Chrome Android, Internet Explorer Desktop) et son identifiant mobile (IDFA sur iPhone ou GFA sur Androïd).

On a l’habitude d’entendre les gens rajouter des suffixes après le mot DMP : DMP média, DMP marketing, DMP CRM, DMP connecteurs… Si l’on part de l’acronyme Data Management Platform, on pourrait même dire qu’une base CRM 360 est une DMP... Chez Artefact, une DMP est avant tout média mais doit évidemment être reliée au CRM (onboarding) au risque de perdre une grosse partie de sa valeur ajoutée. Et par média nous entendons qu’elle soit connectée au maximum de manière native à tout l'écosystème média (DSP, AdServer…).

Même si la DMP est relativement neuve, de plus en plus d’annonceurs s’équipent aujourd’hui de DMP. Selon une étude d’Oracle sur le sujet, 100 000 installations de DMP sont envisagées en 2016! L’étape suivante peut être la mise en place d’un datalake.

Un datalake pour réaliser des analyses complexes

Un datalake est une gigantesque base de données qui va stocker à peu près tout ce qu’il est possible de stocker : les données marketing bien sûr mais pas seulement. On peut aussi y stocker les autres informations de l’entreprise comme celles venant de l’ERP (logistique, facturation, supply chain). On peut aussi y déverser des données provenant de sources exogènes comme des tweets. La donnée peut-être non structurée. Il s’agit systématiquement de clusters big data (Hadoop, Spark…). L’objectif est de capter un maximum de données pour ensuite pouvoir réaliser des calculs complexes comme par exemple une segmentation poussée ou un scoring prenant en compte de nombreux paramètres.

Le datalake peut s’alimenter des données du CRM 360 et de la DMP, en utilisant l’ID CRM comme clé de réconcialiation. Le datalake va alors permettre de calculer par exemple des scores d’appétence sur des prospects ayant effectué un devis (et donc enregistré dans le CRM 360) en y ajoutant des variables telles que la réaction aux bannières publicitaires (le prospect a t il cliqué ou pas sur une bannière) ou la navigation non loggée.

La mise en place d’un datalake nécessite une maturité très forte des entreprises, à la fois en terme d’IT évidemment mais aussi en terme de transversalité. C’est ce qui explique que très peu d’entreprises soient parvenues aujourd’hui à mettre en place de manière efficace un datalake.