L'analytics engineer, la valeur montante des experts de la data

L'analytics engineer, la valeur montante des experts de la data A la frontière du data analyst et du data engineer, l'analytics engineer se charge des demandes récurrentes de modélisation des métiers. Une fonction qui exige un bagage technique et des compétences comportementales.

Avec la montée en maturité des entreprises dans la valorisation de leurs données, la famille data ne cesse de s'agrandir. Il est déjà loin le temps où le data scientist "touche à tout" devait se démultiplier passant plus de temps à préparer un jeu de données qu'à modéliser. Au fil des années, les rôles respectifs des experts de la data s'affinent et de nouveaux métiers se créent pour combler les trous dans les organigrammes.

Il y a quelques années on avait fait la connaissance du machine learning engineer. Il fait le pont entre le data engineer et le data scientist en assurant la mise en production des modèles algorithmiques. Apparu en 2018 aux Etats-Unis, un nouveau venu a fait plus récemment son apparition en France : l'analytics engineer. Maîtrisant à la fois l'ingénierie des données et les enjeux business de son entreprise, il se situe à la frontière du data analyst et du data engineer.

"Là où un data analyst va passer beaucoup de temps à analyser les données, l'analytics engineer va plutôt réfléchir à comment modéliser la donnée pour la rendre accessible aux utilisateurs finaux", explique l'Albert School, une nouvelle business school "100 % data driven". De cette manière, ces utilisateurs vont pouvoir répondre en grande partie eux-mêmes aux questions qu'ils se posent. Pour cela, un analytics engineer va transformer, tester, déployer et documenter les données qu'il manipule."

Cet analytics engineer vient combler une lacune fonctionnelle observée dans les data et les IA factories. Classiquement, quatre types d'acteurs collaborent au sein d'une chaîne collaborative dédiée à la data. Le métier définit les objectifs business. Le data engineer prépare la donnée pour le data scientist qui va modéliser. En bout de chaîne, les opérationnels industrialisent et mettent en production le modèle.

"Cette organisation type présente quelques lacunes, estime Didier Gaultier, directeur data science & AI chez Business & Decision (groupe Orange) et directeur pédagogique de l'École de la Data & de l'IA. Les métiers ne savent pas toujours quoi demander aux data scientists ou ne connaissent pas précisément les apports et les limites de l'intelligence artificielle."

Différentes approches comme la mise à disposition des outils de BI en self-service ou la tendance au data mesh visent à redonner la main aux métiers. Il s'agit de favoriser l'accès aux données afin que ces derniers se fixent eux-mêmes des objectifs et tirent des enseignements (insights) de cette matière première. Pour autant, il manque souvent un expert de la donnée qui va fournir les données prêtes à être analysées, en s'assurant qu'elles sont nettoyées et codées au bon format.

Construit des modèles sur les projets récurrents

C'est là qu'intervient l'analytics engineer avec son double profil IT et métier. Doté de compétences en statistiques, il joue un rôle plus technique que le data analyst sans aller jusqu'à l'algorithmie de modélisation, chasse gardée du data scientist. Il doit, au contraire, décharger ce dernier. "Les data scientists sont très sollicités, rappelle Didier Gaultier. S'agissant d'une ressource rare donc chère, les organisations cherchent à les utiliser de la meilleure façon possible, en leur confiant des tâches complexes."

Alors que le data scientist est accaparé par les projets prioritaires et de long terme, l'analytics engineer va, lui, répondre à des besoins simples des métiers dans un délai court de quelques jours ou quelques semaines. "Une direction marketing veut, par exemple, savoir qu'elle est la part de marché d'un produit", illustre Didier Gaultier. Mettre un data scientist sur ce type de demande, c'est comme utiliser une marteau pilon pour écraser une noix."

Cofondateur et directeur d'Albert School, Grégoire Genest voit, lui, plutôt l'analytics engineer comme un relais du data analyst. "Certaines demandes métiers se basent sur les mêmes modèles, les mêmes indicateurs de performances. Elles peuvent être confiées à l'analytics engineer permettant ainsi au data analyst de se concentrer sur des missions à plus forte valeur ajoutée." Alors que data analyst a une approche services, l'analytics engineer a une approche produits. "Il construit des modèles sur des projets récurrents." Quel que soit le cas de figure, les décisions business qui sont prises par les modèles proposés par l'analytics engineer peuvent être très impactantes. Il doit donc s'assurer qu'il n'y a pas de biais, que les données ont été extraites depuis bonnes sources avec les bons outils.

MLOps et cadre de gouvernance

Comme les autres experts de la data science, l'analytics engineer s'inscrit dans le cadre méthodologique du MLOps. Sorte d'équivalent du DevOps en data science, le MLOps comprend, entre autres, un feature store, un magasin de données préparées et injectables directement dans un modèle d'IA, et un component store, une bibliothèque partagée de modèles et d'algorithmes déjà testés, documentés et prêts à fonctionner avec les données du feature store.

L'analytics engineer se sert de ces briques réutilisables pour répondre à des demandes récurrentes comme mesurer le taux d'attrition. Il doit non seulement suivre ces processus méthodologiques mais aussi les enseigner au métier.

l'analytics engineer doit justifier d'un certain nombre de compétences comportementales

Pour Didier Gaultier, il s'agit, par ailleurs, de poser le bon cadre de gouvernance. "Qui fait quoi dans la chaine de production et de modélisation ? Selon quels processus ? Le rôle entre les métiers, les data scientists et les data engineers n'est pas toujours clair. Il y a d'un côté des demandes industrialisées et, de l'autre, des demandes spécifiques et/ou urgentes qui ne doivent pas perturber pas le fonctionnement de la chaîne."

Au-delà de ses connaissances en IT et en data science, l'analytics engineer doit justifier d'un certain nombre de compétences comportementales, à commencer par une aisance relationnelle pour dialoguer avec les métiers. Doit-il être hiérarchiquement rattaché à la DSI ou au métier ? Pour éviter les risques de conflit d'intérêt ou d'incompréhension, il est préférable que l'analytics engineer conserve son indépendance en intégrant une squad transverse.

Sa rémunération semble se caler sur celui du data d'engineer. Albert School évoque un salaire de 38 à 50 K€ pour un débutant et de 60 à 85 K€ pour un expert (plus de 5 ans d'expérience). En revanche, il ne peut rivaliser avec les émoluments du data scientist, la star de la data science, sachant qu'une certaine séniorité dans le poste est exigée, la demande en data scientists juniors étant très faible. "Un data scientist peut faire ses premières armes en occupant le rôle d'analytics engineer en début de carrière, note Didier Gaultier. Ce qui lui évitera de faire de la technique matin et soir comme le data engineer."

En ce qui concerne cette fois l'évolution de carrière de l'analytics engineer, celle-ci peut prendre trois directions. Profitant du flou entre les périmètres fonctionnels des différents experts de la donnée, il peut devenir data analyst, data engineer ou data scientist, selon qu'il choisisse de renforcer son expertise métier ou tech. Pour Grégoire Genest, son profil hybride peut aussi le conduire à occuper le poste de Chief data officer.