Machine learning engineer : nouveau métier star de la data science

Machine learning engineer : nouveau métier star de la data science Profil encore émergent, il fait le pont entre le data engineer et le data scientist en assurant la mise en production des modèles algorithmiques. Des écoles dédiées à ce nouveau profil viennent d'ouvrir.

Le data scientist n'est plus le métier en or, la super star du numérique que tout le monde s'arrache. Il est détrôné par un autre expert de la data science : le machine learning engineer. Encore émergent, son rôle consiste à optimiser, déployer et maintenir les algorithmes développés par le data scientist en utilisant les flux de données préparés par le data engineer. Publié en avril 2018, un article du cabinet de conseil O'Reilly évoquait les facteurs qui président à la création de ce nouveau métier. Le machine learning engineer fait la jonction entre le data scientist aux capacités de programmation limitées, et qui se concentre sur la conception de modèles et non leur mise en production, et le data engineer à qui il manque cette dimension analyse.

Ce nouveau profil vient ainsi soulager le data scientist à qui on demande beaucoup. Mouton à cinq pattes, il devrait avoir des compétences en algorithmie, en statistiques voire en data visualisation tout en développant une expertise métier. "Sauf exception, il est impossible de réunir toutes ces compétences", prévient Didier Gaultier, directeur data science & AI chez Business & Decision (groupe Orange). Selon lui, il est "très difficile" de se positionner à la fois sur la modélisation, le contact avec le métier, tout en maitrisant toutes les techniques du big data. "Il faut tenir un discours de vérité et rappeler la réalité du terrain en oubliant les paillettes et le discours marketing autour du data scientist. C'est moins vendeur mais plus efficace", estime Didier Gaultier.

Une première formation spécialisée

Pour Karl Neuberger, partner chez  Quantmetry, l'émergence du machine learning engineer coïncide avec l'arrivée à maturité en matière d'intelligence artificielle d'un nombre croissant d'entreprises. "Elles sont passées du stade de la preuve de concept à la phase d'industrialisation. Pour tirer toute la valeur de l'IA, elles doivent couvrir tout le cycle de vie d'un modèle, de sa conception à son monitoring en passant évidemment par son déploiement. Et c'est là que le machine learning engineer entre en jeu", confirme Karl Neuberger. "Dans le domaine, par exemple, de la détection des fraudes, les techniques des pirates évoluent sans cesse. Un machine learning engineer va détecter les dérives du modèle et l'adapter aux nouveaux comportements des fraudeurs." Pour le consultant, plus de la moitié des data scientists a vocation à terme à devenir machine learning engineer. "C'est le nouveau parcours de carrière pour faire de l'IA vraiment appliquée", assure-t-il.

"Un recruteur qui a le choix entre ce profil et celui d'un data scientist n'hésitera pas longtemps"

Fondateur de la Yotta Academy, start-up issue de Quantmetry, qui revendique "la première formation dédiée au métier de machine learning engineer" en France, Sacha Samama entrevoit deux trajectoires possibles pour devenir machine learning engineer. "Dans l'acceptation anglo-saxonne, le machine learning engineer est un ingénieur logiciel full stack qui monte en compétences dans l'IA. En France, l'évolution est inverse. Il s'agit d'un profil de data scientist qui évolue vers l'ingénierie. C'est le chemin que j'ai suivi."

A ses yeux, la formation initiale en data science, dispensée par les écoles d'ingénieurs ou les cursus spécialisés, est trop axée sur la théorie. "Ces programmes forment des pseudos data scientists dont le profil ne correspond plus au niveau d'exigence requis tant celui-ci a évolué. Ils devraient maîtriser à la fois les algorithmes et les pratiques et développement back-end ou encore la démarche DevOps."

Axé "à 80% sur la pratique", le bootcamp de quatre mois dispensé par la Yotta Academy vise justement à apporter cette dimension. Baptisé MLE (pour machine learning engineer) Bootcamp, il s'adresse à la fois à des master 2, des doctorants ou des ingénieurs en reconversion. Le programme débute par une piscine (sur le modèle de l'école 42) pour homogénéiser les expériences, puis se déroule en trois parties. Il y a tout d'abord un volet data science généraliste qui dresse un état de l'art en machine learning et deep learning. Le deuxième module porte sur l'ingénierie proprement dite ou comment déployer les modèles. Le programme évoque aussi la question de la sécurité et de la conformité au RGPD. Enfin, le dernier module porte sur les compétences comportementales. Parmi ces "soft skills", attendus d'un machine learning engineer, on trouve la capacité à s'adapter à un monde en perpétuelle évolution technologique. "Un framework peut être disrupté en l'espace d'un an", observe Sacha Samama. "Il y a 3 ou 4 ans, R et Python étaient sur un pied d'égalité. Depuis, Python a emporté la mise, ce langage étant davantage adapté à la mise en production."

Didier Gaultier évoque d'autres compétences comportementales comme la capacité d'analyse (hiérarchiser les informations, cerner les problématiques), la méthodologie (travailler de manière organisée et en équipe), la rigueur scientifique (mode de raisonnement inductif), l'autonomie, la capacité d'écoute, la compréhension client, l'esprit d'équipe et la curiosité intellectuelle.

"Il s'agit d'intervenir dans la mise en œuvre d'une data gouvernance"

En cours de certification auprès de France compétences, le MLE Bootcamp a accueilli une première promotion de douze personnes début 2020 et prévoit une deuxième session d'ici la fin de l'année, avant de passer à trois promotions en 2021. Les cours sont dispensés par des experts de Quantmetry et des intervenants extérieurs.

A priori, pas de problèmes de débouchés à l'issue du bootcamp de Yotta Academy. "La superstar aujourd'hui sur le marché de la data science, c'est le machine learning engineer. Un recruteur qui a le choix entre ce profil et celui d'un data scientist n'hésitera pas longtemps", estime Sacha Samama. "Et si un lauréat fait le choix d'être indépendant, il pourra prétendre en moyenne à une rémunération de 700 à 1 200 euros par jour en fonction de sa séniorité." Parmi les entreprises partenaires qui cofinancent le programme, on trouve des start-up, des sociétés de conseil et même des clients finaux comme la SNCF.

Se reconvertir ensuite en deep learning engineer

Partant également du constat d'un décalage entre formations initiales et réalité de terrain, Business & Decision a lui aussi créé son école début 2019. Baptisée L'Ecole de la Data, elle propose des formations de data engineering, de data scientist et de data analyst. Pour Didier Gaultier, qui en est le directeur pédagogique, le machine learning engineering est une sous-partie du data engineering. "Il s'agit dans les deux cas d'aller au-delà de la data science et d'intervenir dans la mise en œuvre d'une data gouvernance. Il s'agit avant tout d'ingénieurs de la data", souligne le consultant.

Certifié France Compétences et faisant l'objet d'un dépôt auprès du Répertoire national des certifications professionnelles, le cursus de data engineer de L'Ecole de la Data est conçu en trois modules d'un mois chacun. Le premier porte sur la préparation des données et le deuxième sur la conception d'infrastructures big data. Le troisième module concerne plus spécifiquement le métier de machine learning engineer et la mise en production des modèles. Il aborde les technologies de containerisation (Docker) et des méthodologies de type DataOps et IAOps qui visent à éviter les cassures dans la chaîne de déploiement. Ce module est proposé avec l'aide d'éditeurs partenaires comme Dataiku et Knime.

Didier Gaultier conseille aux profils juniors sortis d'une école de data science de débuter plutôt comme data engineer. "Le data engineer travaillera avec des gens plus seniors, suivra une courbe d'apprentissage de deux ou trois ans qui lui permettra d'acquérir une solide expertise technique et méthodologique. Ensuite, il aura le choix. Il pourra devenir data scientist ou évoluer vers le métier de machine learning engineer avant de devenir data architect." Pour Sacha Samama, le machine learning engineer a aussi la possibilité de se spécialiser dans certains domaines algorithmiques en vue de se convertir ensuite en deep learning engineer.