Big data, machine learning et intelligence artificielle... Les vérités de la publicité en ligne

Dans le domaine de la publicité en ligne, le nombre de fois où vous entendez le terme “big data” relève probablement... du big data. Si vous essayez de comprendre ce qui se cache derrière ces mots, vous n’entendrez généralement que “les data sont vraiment énormes”, “mon algorithme est le meilleur”...

Le Big data

Tout le monde a compris intuitivement le concept : il y a beaucoup, beaucoup de données ! Le cabinet de recherche Gartner précise la signification de “beaucoup” : Volume (le nombre de données), Variété (le type et les sources de données), Vitesse (la fréquence à laquelle on les reçoit).

Mais malgré cela, tout n’est pas du ressort du big data dans la publicité en ligne. La règle générale au “doigt mouillé” : quand ça tient dans un excel ça n’est probablement pas du big data. Par exemple : segmenter des consommateurs selon les pages visitées sur un site, ça n’est probablement pas du big data… En revanche mettre à jour cette segmentation toutes les heures en y ajoutant les données d’achat des internautes, leur réaction à différents messages publicitaires, y attacher les images des produits vus… là on y est.

Alors y a-t-il vraiment du big data dans la pub en ligne ? Oui, car avec un peu d’argent (juste quelques milliers d’euros) on achète des millions d’affichages de publicité sur internet (par exemple sous forme de bannières sur des sites), et à chaque affichage il y a moult données assorties (le cookie, l’heure, le format de pub, la page, le clic, etc.) et enfin, il est possible de les récupérer en temps réel (à l’échelle de la seconde). 

Pourquoi le big data est-il aujourd’hui sur toutes les lèvres ? Premièrement, le nombre de données a explosé du fait de la digitalisation (on passe plus de temps sur internet et on y laisse plus de traces : clics, post, message, etc.). Ensuite, les infrastructures de stockage des données ont dû s’adapter pour tenir le choc. Enfin, les outils/logiciels pour gérer ces données (faire des calculs, les visualiser, etc.) doivent être différents (on ne peut pas utiliser Excel), et par conséquent les compétences sont différentes. 

Mais la question est surtout de savoir ce que les différents intervenants de la publicité en ligne font avec toutes ces données. La plupart n’en font en réalité pas grand-chose, car le traitement est difficile et très franchement, en général on ne sait pas trop quoi en faire ou pire, ce qu’on doit y chercher. 

Première conclusion clé : Lorsque vous ne dirigez pas les efforts d’exploitation du big data avec une application précise en tête, cela ne sert à rien. Criteo utilise par exemple le big data pour sa fameuse application publicitaire de retargeting, et les données lui servent à améliorer son taux de clics. De même pour la publicité digitale locale : les données sont utilisées pour détecter les meilleurs messages/promos/produits pour les consommateurs autour de la zone de chalandise de chaque magasin d’une enseigne.

Algorithme / Machine Learning / Intelligence artificielle (IA)

Une fois toutes ces données récoltées, on peut essayer de détecter des tendances et en déduire des actions systématiques - par exemple quand le taux de clics d’une publicité est trop bas, on ne l’achète plus. On peut ainsi automatiser des actions (j’achète / je n’achète pas) par la machine et selon des règles que l’on a fixées.

Qu’est-ce que le machine learning ? La machine exécute quelque chose qu’on ne lui a pas commandé : elle se crée ses propres règles. Et elle y parvient car on lui laisse la liberté d’essayer et donc de se tromper de temps en temps et ainsi intégrer le fait qu’elle doit apprendre de ses erreurs. Et ce de manière continue. Le machine learning est donc une forme d’intelligence artificielle au même titre que la résolution de problème, prévoir, lire et comprendre des textes, interpréter des images ou des sons, etc... 

Quel est le rapport avec le big data ? Pour apprendre, les machines doivent se nourrir de données, elles exploitent donc le big data pour “devenir intelligentes”.

Nous connaissons tous cette phrase magique dans la publicité : “j’utilise des algorithmes de machine learning pour optimiser ma campagne publicitaire”. Cela n’est pas vrai dans la plupart des cas car il est très difficile de créer des intelligences artificielles qui résolvent tous les cas d’usage de la publicité. Vous pouvez utiliser du machine learning pour choisir les meilleurs sites sur lesquels afficher une publicité étant données les caractéristiques de la marque et de l’audience cible, pour optimiser le taux de clics sur une gamme de produits, etc. mais vous n’avez pas encore d’intelligence artificielle qui sache régler tous ces problèmes en même temps. 

Deuxième conclusion clé : l’IA sert à quelque chose quand elle est capable d’aider l’humain à faire des actions trop fastidieuses, trop compliquées ou trop coûteuses avec une application métier précise en tête. La publicité locale est un cas d’école : lorsque vous êtes une enseigne qui compte 500 magasins, vous devriez théoriquement faire 500 campagnes publicitaires (une par magasin ciblant sa zone de chalandise) et les optimiser indépendamment puisque les gens réagissent aux publicités très différemment d’un magasin à l’autre… mais c’est beaucoup trop compliqué et/ou non viable économiquement de gérer 500 campagnes publicitaires “à la main”. Il faudrait une armée de consultants pour le faire. Il a donc fallu construire une intelligence artificielle – comme c’est le cas avec la “publicité multilocale” - pour résoudre cette complexité opérationnelle, à savoir optimiser les campagnes publicitaires pour 500 magasins en même temps. 

Mais cette intelligence artificielle doit avoir une supervision humaine pour qu’elle accomplisse bel et bien des objectifs métiers, à savoir amplifier au mieux les messages des magasins auprès des consommateurs à proximité.

Le big data, machine learning, intelligence artificielle dans la publicité en ligne n’est donc pas un fantasme, encore faut-il savoir ce que l’on cherche à faire !