Le traitement des données, nouvelle source de pouvoir : le cas des moteurs de recommandation

Pour un marchand, le moteur de recommandation est un outil marketing puissant qui permet d'augmenter significativement le CA des ventes additionnelles. Aujourd'hui, ce type de service a atteint une maturité telle qu'il serait contre-performant de s'en passer.

L’importance du rôle des moteurs de recommandation s’est développée en même temps qu’a crû le commerce en ligne. Avec une croissance soutenue ces dernières années, en moyenne ces quatre dernières années 17% en valeur sur le B2C à l’échelle mondiale (E-commerce worldwide - Statista Dossier) pour atteindre aujourd’hui 1 700 G€ (60 G€ en France, FEVAD Médiamétrie), le commerce en ligne est le canal d’achat qui a le plus fortement progressé.

Dans ce type d’accès à la consommation, on notera la croissance particulièrement forte des places de marché, les market places, avec une hausse de 53% du chiffre d’affaires (CA) entre 2013 et 2014 en France (FEVAD).

Définition
Proposer des objets susceptibles d'intéresser un individu, tel est l'objectif d'un moteur de recommandation. Le champ de ces objets est immense. Ce peut être des chansons, des programmes télévisés, des films, des livres, des appareils électroménagers, des destinations touristiques, des contacts professionnels et tant d'autres que l'individu pourrait apprécier, qu'il soit simple utilisateur ou bien consommateur.

Un moteur de recommandation est donc un ensemble de règles applicables à des informations provenant de l'individu immergé dans un ensemble beaucoup plus vaste, celui des objets qu'on peut lui proposer et celui des autres individus.

De façon simpliste, le raisonnement est le suivant : "Les utilisateurs regroupés selon des critères proches de ceux l'utilisateur ciblé ont apprécié une dizaine de livres. On proposera donc à notre utilisateur les livres à grand succès". Comme pour les moteurs de recherche, la pertinence de ces suggestions sera un élément clef du choix de l'utilisateur lorsqu'il s'agira de recourir à un service.

Quoi de plus attristant qu'un site web proposant un vulgaire casse-noisette alors qu'on a déjà acheté des albums de musique classique, qu'on est à l'approche de Noël, qu'on vient d'un site de spectacles de ballets !

Intérêts de la recommandation
Les intérêts des moteurs sont multiples. On retiendra principalement l'amélioration de la recherche première d'un utilisateur et la génération de ventes additionnelles.

Lorsqu'on cherche un bien ou un service sur un site, on soumet une requête avec des a priori de réponse attendue. En tant qu'individu social, l’utilisateur est soumis aux lois de la statistique. Ainsi, il y a une probabilité importante pour que d'autres aient effectué la même recherche avant lui. Leurs réflexions individuelles les ont conduit à un ensemble de résultats. En suggérant à l’utilisateur les éléments les plus fréquents à côté de la réponse brute, on tire profit de la réflexion de ceux qui l’ont précédé. Libre à l’utilisateur de confirmer ou non la pertinence de ces suggestions en enrichissant à son tour la statistique utilisée par le moteur de recommandation.

Le second intérêt découle plus ou moins directement du premier qui vient d'être présenté. C'est l'intérêt commercial essentiel des ventes additionnelles. La base du commerce est que le consommateur se sente unique, preuve rassurante de son existence. La personnalisation est donc un passage obligé. Mais dans une consommation de masse de produits industriels, la personnalisation est, sinon une illusion, au moins un défi. Il est donc indispensable de pouvoir présenter au consommateur les produits les mieux adaptés à son profil spécifique. On estime à près de 30% la part des ventes réalisées par Amazon grâce aux ventes additionnelles.

Au-delà, la satisfaction du client d’avoir trouvé l’objet recherché améliore sa fidélité et donc la publicité qu’il fera autour du site.
Si plusieurs sites d'e-commerce, parfois parmi les plus prestigieux, proposent encore aujourd'hui des produits liés à d'autres de manière statique suivant les exigences des équipes du marketing, c'est surtout par crainte de perdre la maîtrise de l'offre commerciale. Ainsi, un nouveau produit pourrait se trouver être rarement suggéré ; ce qui serait incompatible avec les budgets de communication engagés autour de son lancement. La maturité actuelle des moteurs de recommandation dissipe ces dernières réticences.

Des données, des données et encore des données
Ce qui précède indique en filigrane que le volume et la qualité de données sont primordiaux dans la qualité des recommandations. Le BigData est tout proche…
Les premières informations facilement accessibles sont celles sur les produits proposés. Ce sont les données techniques, fournies par les producteurs, et les informations marketing, plus subjectives, qui offrent une base des données Produits maîtrisée.


Les informations sur les utilisateurs sont plus compliquées à obtenir. Deux principaux types de recueils de données peuvent être mis en place. La manière explicite qui grâce à un questionnaire permet de caractériser au mieux l’utilisateur. Cela demande que ce dernier accepte de se livrer, ce qui peut donc l’en dissuader.

La seconde manière, plus subtile, permet de dresser le profil de l’utilisateur à mesure de son parcours. Des similitudes entre certains comportements d’individus différents apparaissent et permettent de les rassembler dans des groupes. On parle de mécanisme d’apprentissage automatique (Machine Learning).

Bien sûr, les mécanismes faisant appel aux deux types existent.

À partir là, la base de données Utilisateurs est à son tour maîtrisée.

Un algorithme adapté aux données disponibles

Une fois ces deux bases de données amorcées, le moteur de recommandation va puiser dedans pour faire correspondre à un groupe réduit d’utilisateurs un groupe réduit de produits au travers d’algorithmes adaptés à chaque situation. Ici, une situation peut être un besoin marketing spécifique tel que la relance d’un produit.

On a vu que parfois les données disponibles pouvaient être peu nombreuses. Dans ce cas, les algorithmes recourant à l’inférence bayésienne donnent de meilleurs résultats que les méthodes de statistiques classiques. Le défaut des méthodes bayésiennes réside dans les besoins importants en performances de calcul pour produire rapidement la recommandation. À l’inverse, les méthodes classiques sont beaucoup plus rapides mais moins fiables lorsque la taille de l’échantillon utilisé pour l’apprentissage est réduite.
Lorsque les données s’accumulent, la qualité des recommandations générées par le moteur devient comparable dans les deux cas.

Une stratégie marketing, un type de recommandation

On peut distinguer trois types de recommandations courants permettant de proposer les produits susceptibles d’intéresser l’utilisateur.

D’abord, la recommandation Personnalisée basée sur l’historique comportemental (achat, lecture, écoute, etc.) de l’utilisateur et sur ses actions (temps passé sur une page, clic sur un lien, etc.). Assez basique, elle est très fiable car elle prend peu de risque. En contre-partie, la possibilité de proposer des objets surprenants quoiqu’adaptés et capables de générer une meilleure vente additionnelle est plus faible (quand on cherche une paire de tennis, et qu’on nous propose une paire de baskets, il y a moins de chance de l’acheter qu’un grip de raquette).


Vient ensuite la recommandation Objet basée sur la proximité des intérêts de l’utilisateur et des attributs du produit (thème, prix, fabrication, etc.). C’est une recommandation facile à mettre en œuvre pour laquelle la faiblesse provient des données subjectives difficiles à faire correspondre aux intérêts de l’utilisateur.
Troisième type, la recommandation Sociale basée sur la comparaison de l’utilisateur au groupe comportemental auquel il appartient. Les objets sélectionnés par les autres membres de ce groupe lui seront suggérés. Ce type de recommandation est très performant, mais demande des ressources de calcul importantes.

Enfin, et c’est souvent le cas, c’est par hybridation de ces trois principaux types qu’on obtient les meilleurs résultats. L’exemple du Netflix Prize en 2009 en est une illustration : comment améliorer sensiblement les performances de recommandation pour les films proposés ? Les lauréats (BellKor's Pragmatic Chaos) avaient développé un mélange composé de centaines d’approches.
In fine le choix fait par l’utilisateur parmi les produits suggérés alimentera en retour les bases de données rendant ainsi le moteur de recommandations encore plus précis.

Plusieurs solutions, mais surtout la vôtre

Les solutions de moteur de recommandations disponibles sont nombreuses. Elles s’intègrent à l’écosystème informatique sous la forme de modules dédiés (Intershop,  Demandware, Hybris, Magento, Drupal Commerce, etc.) permettant de s’interconnecter au moteur souvent hébergé en mode SaaS.

La plupart d’entre-elles sont payantes (Target2Sell, Nuukik, Pigdata, Nosto, Selligent, etc.). La tarification est souvent forfaitaire en fonction de paliers de volume de pages consultées. Elle peut aussi se faire au prorata du CA.

Dans une utilisation purement commerciale, il est important d’avoir en tête que le coût investi dans la solution est secondaire devant le profit dégagé par les ventes additionnelles. Ainsi, de manière simplifiée, on préfèrera un moteur générant 30% de ventes additionnelles (en valeur) et prélevant 10% de marge sur chaque transaction à un moteur ne prélevant que 5% de marge mais ne générant que 20% de ventes additionnelles.
Finalement, un moteur de recommandation est la version électronique du merchandising et du facing, la souplesse et la réactivité de la dématérialisation en plus !

Pour aller plus loin