Chez Criteo, IA rime avec big data temps réel

Chez Criteo, IA rime avec big data temps réel La plateforme publicitaire fête le premier anniversaire de son AI Lab. L'occasion de revenir sur ses premiers projets déployés sur le front de l'intelligence artificielle.

Il y a tout juste un an, Criteo inaugurait son AI Lab. Doté d'un investissement de 20 millions d'euros, il fédère à ce jour 30 chercheurs, 60 ingénieurs et 5 doctorants. Avec cette nouvelle entité complétant sa R&D historique, le spécialiste du reciblage publicitaire affiche plusieurs axes prioritaires : optimiser ses performances en recommandation de produits, bâtir des modèles de deep learning optimisant sa plateforme publicitaire, ou encore estimer l'impact réel des promotions qu'il pousse sur l'acte d'achat.

"L'AI Lab a pour mission de plancher sur des prototypes puis d'en faire de nouveaux produits capables d'encaisser notre trafic. Nous gérons 3 milliards de publicités affichées chaque jour pour 5 à 10 milliards de produits analysés quotidiennement chez nos clients marchands", explique Romain Lerallut, directeur-adjoint du Criteo AI Lab, "Le Lab a aussi pour mission de contribuer à l'écosystème de la recherche en intelligence artificielle", ajoute-t-il

Depuis le lancement de la nouvelle structure, les résultats sont là. Le laboratoire en intelligence artificielle de Criteo a donné lieu à quelque 25 publications scientifiques. Il met en parallèle plusieurs data sets d'entrainement à disposition de la communauté des chercheurs, dont un jeu de données de 4 milliards de lignes pesant 1 To, l'un des plus volumineux jamais publié sur le web. Côté produits, Criteo commence également à injecter du deep learning dans son offre. L'éditeur français vient de refondre le moteur de recommandation de sa solution Considération. Un service centré sur l'acquisition de nouveaux clients.

"Dès 2012, nous avons mis en œuvre des modèles de machine learning"

Mais Criteo n'a pas attendu l'ouverture de son AI Lab pour s'équiper d'algorithmes de learning. "Dès 2012, nous nous sommes tournés vers la régression logistique. Ce modèle a l'avantage d'atteindre un niveau de performance en phase avec nos besoins d'acheter et diffuser en temps réel des emplacements publicitaires en masse. En revanche, cette technologie implique un gros travail manuel (pour créer les variables d'apprentissage, ndlr)", commente Romain Lerallut, avant de reconnaître : "Le deep learning, à l'inverse, offre un environnement beaucoup plus automatisé." Il permet en effet de traiter des problèmes non structurés sur lesquels on ne dispose potentiellement d'aucune information au préalable.

Pour construire le réseau de neurones de son service Considération, l'AI Lab de Criteo s'est inspiré de l'architecture des modèles de deep learning orientés NLP (pour natural language processing). "Ces algorithmes analysant des séquences de lettres, nous sommes partis du principe qu'en les adaptant nous pourrions gagner en performance dans le traitement de nos séquences de produits", précise Romain Lerallut. Résultat, aux côtés du surcroît d'automatisation attendu, le nouveau moteur permet d'atteindre un niveau de matching entre visiteurs et produits 15% supérieur à la solution précédente. L'indicateur est issu d'un A/B test réalisé entre l'ancien et le nouveau moteur.

"Nous cherchons des modèles de deep learning capables d'encaisser 2 milliards d'internautes quotidiens avec une milliseconde de temps de réponse"

Evidemment, Criteo étudie d'autres pistes de mise en application du deep learning dans le cadre de sa politique produit. Dans cette quête, la société parisienne devra trouver le bon équilibre. "Nous cherchons des modèles offrant un bon niveau de performance en recommandation de produits et dont l'architecture soit, en parallèle, capable d'adresser 2 milliards d'internautes quotidiens en tendant vers une milliseconde de temps de réponse", précise Romain Lerallut.

Les réseaux de neurones de Criteo se doivent également de composer avec une infrastructure de centre de données répartie sur plusieurs plaques géographiques, en Amérique du Nord, en Europe et en Asie-Pacifique. "Les enjeux de distribution de modèles sont importants, sachant qu'ils apprennent en continu. Comme le reste de la plateforme, il est par conséquent vital de les monitorer en continu", complète Romain Lerallut.

Reste un dernier sujet autour de l'IA, qui pour Criteo est des plus stratégiques : le recrutement de chercheurs ou d'ingénieurs en intelligence artificielle. Face à cette question, la création de l'AI Lab représente une première partie de réponse. Dans le sillage de cette initiative, le groupe collabore au master sur l'IA de l'université Paris-Sciences-et-Lettres. Une formation portée conjointement par Dauphine, l'Ecole normale supérieure et Mines ParisTec. Dans le cadre de ce partenariat, Criteo s'est engagé "à accueillir une partie de la promotion et à l'encadrer pendant la durée de la formation au sein de son AI Lab en tant qu'ingénieur en machine learning".

A lire aussi