IA : les compétences qui s'arrachent en France
Courtisés de tous côtés, data scientist, data engineer et data architect dictent leur loi sur le marché du travail. Une spécialité dans la reconnaissance d'images ou le traitement du langage naturel les rend incontournables.
A moins d'avoir bouclé quatre fois le tour du monde en solitaire, impossible d'être passé à côté de l'engouement actuel autour de l'intelligence artificielle. Pas un seul jour ne passe sans qu'un media grand public ne fasse sa "Une" sur ce thème vendeur. Les entreprises se sont aussi emparées du sujet, faisant de l'IA un atout hautement concurrentiel. Fini la phase d'évangélisation et des POC (proof of concept), elles multiplient aujourd'hui les applications industrielles en production.
Autant dire que la bataille autour des spécialistes de la data fait rage sur le marché de l'emploi, sur fond de surenchère salariale. Selon une étude 2019 de data recrutement, un data scientist démarre à 40/44 K€ brut pour atteindre 80/100 K€ et plus après dix ans d'expérience. Afin de pallier le manque de compétences, HEC, l'Essec, Polytechnique ou Telecom ParisTech ont adapté leurs cursus ou créé des masters spécialisés en IA.
"Après la banque et l'assurance, l'industrie, les télécoms ou le secteur de la santé ont investi le terrain de la data science"
Pour autant, la tension reste forte, selon Karl Neuberger, associé chez Quantmetry, cabinet de conseil en data science. "Les premières promotions des grandes écoles sont sorties mais dans le même temps, l'IA s'est généralisée. Après la banque et l'assurance, l'industrie, les télécoms ou le secteur de la santé ont investi le terrain de la data science."
Au niveau mondial, il n'y aurait que 300 000 chercheurs et praticiens de l'IA, alors que la demande se chiffre en millions selon une enquête de Tencent Research Institute datant de décembre 2017. Pour desserrer l'étau, le député Cédric Villani propose dans son rapport, publié en mars 2018, de tripler le nombre de personnes formées à l'IA en trois ans, en étendant notamment le champ des talents aux bac +2 et +3. Avec son Ecole IA, développée en France en partenariat avec Simplon, Microsoft cible, lui, les publics éloignés de l'emploi (personnes en reconversion professionnelle, décrocheurs scolaires…).
La féminisation pourrait être une autre planche de salut. Alors que la proportion des femmes dans le numérique stagne autour de 20%, "l'IA pourrait susciter davantage de vocation chez les jeunes diplômées notamment sur les thèmes de la santé et l'environnement", estime Sophie Monnier, data scientist senior chez Quantmetry. Le cabinet qui l'emploie compte un tiers de femmes dans ses rangs et participe aux meetups Paris Data Ladies. Autre piste : la reconversion des professionnels du chiffre, comme les actuaires en assurance ou les statisticiens, en experts de la data science.
L'excellence française
En attendant cette démocratisation des métiers de l'IA, l'état pénurique fait le bonheur des spécialistes de la donnée, à commencer par le plus connu d'entre eux, le data scientist. Combinant des compétences en mathématiques, en statistiques et en informatique, il conçoit des modèles algorithmiques afin de créer de nouveaux business models ou optimiser des processus existants.
"Le data scientist qui sort d'une grande école a le choix de sa trajectoire, observe Karl Neuberger. Il peut se voir proposer de très belles missions par un grand groupe, ou faire le choix d'une start-up ou d'un cabinet de conseil. Face à la demande, de plus en plus de profils s'orientent vers le freelancing." "Le recrutement des spécialistes de la data se fait essentiellement par réseau et cooptation, complète Sandrine Delsol, consultante senior à la division IT digital de Robert Half. Et quand des profils apparaissent sur le marché, ils sont captés par les acteurs de la bancassurance et les start-up sexys. Il ne reste plus grand monde pour les autres recruteurs."
Du coup, explique-t-elle, des recruteurs font du sourcing à l'étranger. "Les pays du Maghreb et de l'Europe de l'Est ont davantage valorisé les filières de l'A que la France. On y trouve des ingénieurs en grand nombre et notamment des femmes". A l'inverse, les ingénieurs français peuvent faire le choix de l'étranger où l'excellence française est reconnue, asséchant encore plus le vivier hexagonal. Nos mathématiciens et chercheurs en sciences cognitives s'exportent, en effet, très bien. Des français occupent même des postes clés chez le GAFA, à commencer par Yann LeCun, directeur du laboratoire de recherche en IA de Facebook ou Emmanuel Mogenet, à la tête de Google Research Europe.
Des hard skills mais aussi des soft skills
En dépit de l'hyper-sollicitation dont ils font l'objet, les data scientists ont su, au fil du temps, ajouter d'autres flèches à leur arc. Certains se sont spécialisés dans une discipline cognitive, comme la reconnaissance d'images, le traitement du langage naturel (natural language processing, NLP) l'analyse des données textuelles ou les séries temporelles (time series). D'autres font le choix d'une expertise métier en développant, par exemple, des compétences liées aux données de la santé.
Avec le temps du temps, le degré d'exigence a aussi augmenté côté employeur. "Un data scientist doit non seulement développer un modèle mais être capable d'expliquer en des termes accessibles la manière dont l'IA émet des recommandations ou prend des décisions, poursuit Karl Neuberger. Pourquoi cet outil n'a pas accordé de prêt à Mme Martin ?"
"Un data scientist qui se ferait plaisir techniquement dans son coin ne présenterait pas d'intérêt, complète Marlène Ribeiro, directrice exécutive chez Michael Page. La question "Pourquoi l'IA et à quelles fins ?" doit toujours être constamment présente à son esprit. Le modèle doit servir un usage précis comme la vision par ordinateur dans le domaine de la logistique."
Cette adaptabilité demandée au data scientist suppose qu'il développe un certain nombre de compétences comportementales (soft skills) comme l'aisance relationnelle ou l'aptitude à travailler en mode collaboratif. "Pas question de travailler en silo dans son coin, le data scientist évolue au sein d'une équipe pluridisciplinaire, constate Marlène Ribeiro. Il collabore avec des développeurs, des experts DevOps, des "créas", des spécialistes de l'expérience utilisateur, des gens du business. Travailler ainsi en mode projet avec des personnes qui ne sont pas de votre monde suppose de faire preuve d'empathie."
Data scientist + data engineer = machine learning engineer
Le data scientist ne doit pas être l'arbre qui cache la forêt des experts en data science. A ses côtés, le data engineer va créer tout l'environnement autour du modèle de machine learning ou de deep learning. Il met en place l'infrastructure, les flux de données, règle les problèmes de sécurité et de conformité. Le RGPD introduit notamment le principe du "privacy by design" pour assurer la protection des données personnelles dès la conception d'un nouveau service. Enfin, le data engineer s'assure de la qualité de code et procède aux tests.
"Dans les prochaines années, il y aura convergence entre le data scientist et le data engineer, entre l'algorithmie et la mise en production, prévoit Karl Neuberger. Le premier voulant aller vers l'IT, le second vers la data science." Le terme de machine learning engineer commence d'ailleurs à émerger. Un article d'O'Reilly, société spécialisée dans la formation professionnelle, évoque ce métier à mi-chemin entre les deux mondes.
Autre profil, le data architect conçoit l'architecture logicielle. Quelles briques assembler pour rendre l'ensemble cohérent et performant ? Ce poste peut être occupé par un data scientist senior ou un expert venu de l'IT. Enfin, le data consultant fait le lien entre le métier et les experts de la donnée pour rendre techniquement possible le cas d'usage retenu. Il doit comprendre les enjeux business pour aider l'équipe à construire le modèle le plus pertinent.
A côté de ces métiers de l'IA, on trouve des gens des métiers qui, ponctuellement ou à temps complet, vont formaliser le besoin puis entraîner le modèle et le tester. Une fois en production, ils participeront au monitoring du modèle afin de corriger les éventuelles dérives. Faute de terminologie arrêtée, ces experts fonctionnels sont appelés par certains "éleveurs de robot" ou "coachs de chatbot".
Compétences rares sur les frameworks de machine learning
Au niveau des langages, les deux les plus recherchés sont, de l'avis de tous les experts interrogés, R et Python. "Ils étaient à égalité il y a quelques années sur les algorithmes de machine learning, se souvient Sophie Monnier. Aujourd'hui, la préférence est donnée à Python qui offre plus de libraires et de packages open source." Le langage est notamment utilisé en vision par ordinateur (computer vision), en reconnaissance d'images ou en analyse de texte. Quand on passe à une phase d'industrialisation, Python est généralement associé à Spark, le framework d'analyse de données possédant une API dédiée.
Si des demandes de candidats maîtrisant ces langages R et Python sont courantes, celles portant sur des frameworks propres au machine learning de type Tensorflow Scikit-Learn ou PyTorch sont plus rares. "S'agissant de technologies récentes, les entreprises sont conscientes qu'elles ne trouveront pas ces profils sur le marché, analyse Marlène Ribeiro. Elles font donc le choix de faire monter en compétences des gens en interne. C'est seulement quand les technologies sont arrivées à maturité que les entreprises font appel à des cabinets de recrutement pour trouver des cadres confirmés."
Avec l'émergence des solutions cloud dites d'automatisation du machine learning telles que Google Cloud AutoML, Azure Automated ML et IBM Watson OpenScale, la maîtrise de ces technologies pourrait devenir moins incontournables. "Ces solutions facilitent leur travail quotidien en éliminant les tâches répétitives, tempère Sophie Monnier. Un data engineer va se concentrer sur la partie analytics et moins sur la configuration et le code."
En attendant que ces plateformes se généralisent et pour rester toujours à la page dans un domaine où les technologies et les concepts évoluent en permanence, les data scientists et autre data engineers doivent se remettre perpétuellement en question, faire de la veille technologique et s'autoformer en continu. "Dans ces métiers de l'IA, si vous vous reposez sur vos acquis, vous êtes rapidement has been, tranche Marlène Ribeiro. C'est dur à accepter quand on a fait des études brillantes."
Cette obligation de maintenir son employabilité conduit le candidat à sélectionner son employeur (puisque le rapport de force est inversé) sur d'autres critères que le seul salaire. "Il regarde les possibilités d'évolution, le niveau de l'équipe qu'il va intégrer, les technologies utilisées, les sujets traités", poursuit Marlène Ribeiro. En revanche, revers de la médaille, un expert en IA n'hésitera pas à changer d'employeur dès que l'intérêt des missions ou le niveau technique baisse.