Le machine learning n’est pas encore omniprésent en entreprise, pourquoi ?

Le machine learning continue de faire son chemin et démontre chaque jour un peu plus son potentiel. Ce sont ces technologies qui ont aidé Netflix à répondre aux besoins de ses utilisateurs ou qui apprennent aux assistants numériques à mieux nous comprendre.

Lorsque l’on parle du machine learning et de ses applications en entreprise, il devient tout de suite beaucoup plus compliqué de dresser un portrait clair de cette technologie car son usage a encore du mal à se concrétiser. Erwan Paccard, Director Product Marketing chez AppDynamics France, présente les 8 principaux freins à l’adoption du machine learning que nous devons lever afin de favoriser son déploiement et d’aider les entreprises à profiter pleinement de ses avantages.

La confusion autour de la définition même du machine learning. Contrairement au marché grand public, la lente adoption du machine learning en entreprise est en partie due à la difficulté de comprendre ce qu’il est réellement et ce dont il est capable. Concrètement, le machine learning consiste à appliquer des formules mathématiques sur des données pour en identifier leur nature ou détecter des tendances en isolant l’information utile du bruit de fond. Le rôle du machine learning repose sur l’utilisation d’algorithmes sur les données afin d’en tirer des informations invisibles auparavant.
L’incertitude de la valeur ajoutée du machine learning. Les algorithmes de machine learning ne participent pas aux tournois d’échecs. En revanche, ils savent s’adapter à des contextes changeants tout en continuant de faire la différence entre comportements normaux anormaux, sans intervention humaine. Cela les rend utiles dans de nombreux domaines, de la sécurité à la santé, en passant par les moteurs de classification et de recommandation et les systèmes de reconnaissance vocaux et visuels.
L’intimidation provoqué par une première utilisation du machine learning. Le machine learning est généralement introduit dans une entreprise de deux manières : soit quelques employés commencent à appliquer le machine learning sur les données dont ils disposent afin de mieux les comprendre, soit via l’achat d’une solution intégrant le machine learning (solution de sécurité ou de gestion de la performance applicative). Le premier scénario requiert une certaine connaissance voire un certain niveau d’expertise en data science. Alors que le second scénario est de loin le plus facile à mettre en oeuvre car il permet de tirer très rapidement bénéfice du machine learning.
Le défi quant à l’utilisation des données. Avec le machine learning, beaucoup pensent, ou espèrent, que leur tâche principale sera la collecte de données et de les faire traiter par différents algorithmes. En réalité, une fois que les données ont été collectées, il faut les agréger, vérifier si elles sont bonnes, et faire en sorte que leur structuration puisse s'accommoder de données manquantes, de données inhabituelles, ou de données de piètre qualité.
L’absence d’un guide de labellisation des données. Pour qu’un algorithme puisse donner du sens à un ensemble de données, il doit en comprendre le sens. En résumé, il doit pouvoir attribuer des catégories pré-établies. Le développement et la publication d’un guide de labellisation, sous forme de kit de données ou kit de labellisation, permettrait de faciliter le quotidien des entreprises qui se lancent dans le machine learning. A défaut de disposer d’un tel guide, la plupart des entreprises se lancent dans l’aventure à partir de zéro.
Le besoin de connaissance du domaine. Dans le meilleur des cas, le machine learning est le couple parfait d’un problème et d’un algorithme. Cela signifie que la connaissance du domaine et de son contexte est un prérequis pour une solution de machine learning efficace. Sauf qu’il n’existe pas de méthode standardisée permettant d’obtenir une connaissance précise d’un domaine. Elle se développe au fil du temps dans les organisations, souvent de manière informelle, et ne comprend pas seulement le fonctionnement interne de sociétés et d’industries données, mais également les systèmes informatiques qu’elles utilisent et les données qu’ils génèrent.
Embaucher des spécialistes de la donnée n’est pas la panacée. La plupart des spécialistes des données sont des mathématiciens. Selon leur expérience professionnelle, ils ne possèdent probablement aucune connaissance utile du secteur d’activité de l’entreprise qui l’embauche. Ils doivent donc travailler en tandem aux côtés d’analystes et d’experts du domaine, ce qui augmente fortement le coût de tout projet lié au machine learning.
Le machine learning manque de vocabulaire commun. La principale difficulté rencontrée par les entreprises ayant des succès avec le machine learning est l’absence de consensus sur la manière de formaliser et de communiquer les informations. Ils se retrouvent avec différents groupes, chacun ayant sa propre approche de la formalisation, échantillonnage et structuration des données. Par conséquent, ils aboutissent généralement à des résultats très différents. Cela baisse le niveau de confiance accordé au machine learning et ralenti son adoption jusqu'à ce que des consensus se dégagent.

Le machine learning n’est pas un miracle qui peut travailler en autonomie et faire sens de n’importe quelle donnée. Il requiert encore un investissement humain important, et dans la durée, pour lui fournir les données d’apprentissage, lui apprendre le domaine dans lequel il va intervenir et continuellement le paramétrer pour qu’il s’adapte aux contextes changeants. Mais une fois cette prise de conscience faite et l’investissement nécessaire en place, le machine learning permettra de générer de l’information utile et d’automatiser des actions.