Ne dites plus IA mais data science

L’intelligence artificielle est un terme très en vogue. Il est tellement utilisé, parfois même de façon abusive, qu’il devient difficile de comprendre réellement ce qui se cache derrière.

Les chiffres parlent d’eux-mêmes : 40% des start-ups européennes disant faire de l’IA, n’en font en réalité pas du tout. L’utilisation excessive de ce terme est motivée par une logique commerciale et de communication. En effet, une start-up se prévalant de faire de l’IA verra son financement grimper à un niveau supérieur de 15% par rapport aux autres start-ups (1).

Le constat est sans appel : le terme IA est devenu un mot fourre-tout marketing. Dans ce contexte, comment organiser son expertise et son approche de l’utilisation des données, sans tomber dans un langage fleuri, et parfois très jargonneux ?

La data science : une expertise clé pour tirer parti des données

Nous préférons évoquer le terme de data science qui recouvre des expertises à la fois statistiques, informatiques, et business. La terminologie implique également l’exploration, le traitement, l’analyse et la modélisation des données. La data science fait appel à l’apprentissage statistique tels que le machine learning et le deep learning faisant partie intégrante de l’intelligence artificielle.

Au service des entreprises, cette science de la donnée permet d’améliorer les performances dans de nombreux domaines notamment le marketing. Les cas d'usages sont multiples : la prédiction des ventes, de la valeur client, du churn, l’optimisation des ciblages des campagnes marketing ou encore la personnalisation de contenus en fonction des appétences des clients.

La data science est une combinaison harmonieuse d'ustensiles et d'ingrédients, à l'image des recettes d'un grand restaurant. Les ingrédients, ici les données, sont travaillés avec technicité grâce à des ustensiles de pointe, les algorithmes, pour arriver à un plat final, les prédictions, également appelées scoring.

Le data scientist est à la data science ce qu'un chef cuisinier est à son restaurant : un expert capable d'innover dans ses recettes, à coup d'astuces méconnues, quand bien même les ingrédients initiaux, les data, ne semblaient pas être à la hauteur des ambitions culinaires de ce grand chef. Le data scientist n’applique pas naïvement des modèles préconçus, mais a un rôle très important dans le choix des variables d’entrée, la construction du set de données, et la compréhension fine des modèles.

La cadrage : étape indispensable d’un projet data

Au-delà de la modélisation, il ne faut pas sous-estimer les activités de préparation des données et de cadrage du projet. On peut croire qu’un projet de data science consiste en 80% de modélisation. En réalité, les entreprises se confrontent plutôt à 10 à 20% de modélisation, 40% de préparation des données, et 40 à 50% de cadrage et d’accompagnement jusqu’à l’industrialisation (2).

Le cadrage est une phase primordiale qui permet de préciser le besoin en posant notamment un certain nombre de questions : Pourquoi faire un score de valeur client ? Qu’est-ce que la valeur d’un client ? Sur quelle période prédire la valeur ? Ces questions semblent simples, mais les réponses ne le sont pas pour autant. Au-delà du besoin, des questions doivent aussi être posées sur la disponibilité des données (volume, nature, historique…), et sur les conditions d’utilisation du modèle, sans oublier les contraintes réglementaires liées au RGPD.

Il est important de démystifier certains termes, et de se concentrer sur l’essentiel, à savoir faire bon usage de la data science pour répondre à un besoin, et améliorer in fine les performances business.

(1)   Rapport MMC en partenariat avec Barclays
(2)   Chiffres basés sur l’ensemble des projets de Data Science réalisés par Converteo sur l’année 2018.