Data scientist : magicien des temps modernes ?
Perçu comme une sorte de devin, le data scientist intrigue par son côté omniscient et ses missions ne sont pas toujours très bien comprises. Pourtant, l’explosion du volume et de la variété des données dans les années à venir vont amener ce métier à se populariser.
Avant d’aller plus loin, il est important de souligner les champs d’expertise du data scientist pour éviter la vision simpliste "Big data = data scientist". Celui-ci est amené à intervenir sur différentes typologies de missions. Certaines sont assez classiques, à l’image des missions d’analyse descriptive, de data visualisation ou encore de data mining.
Des missions variéesD’autres sont plus poussées, comme l’analyse de sentiments ou encore l’analyse d’outils d’intelligence artificielle et le machine learning. Le rôle du data scientist est de modéliser les données pour en faire ressortir des indicateurs prédictifs voire prescriptifs. Pour résumer, on peut définir la data science comme l’aboutissement de la chaîne de traitement des données, la note finale d’un concert parfaitement orchestré.
C’est cet aspect prédictif, basé sur des outils d’intelligence artificielle et sur la mise en place de modèles aidant à la prise de décision, qui attire vers ces métiers et qui nourrit le côté "mystique" de la data science. Dépasser la Business Intelligence classique pour se projeter dans l’avenir et faire des préconisations aux clients.
Un véritable chercheur d'orData scientist est un métier résolument tourné vers l’avenir car la donnée est considérée comme l’or des entreprises. Comprendre les données équivaut à maîtriser le savoir. L’explosion des objets connectés (IoT) et des réseaux sociaux va d’ailleurs dans ce sens. Ils sont la source d’un important volume de données semi-structurées voire non structurées qui doivent être traitées dans le cadre de projets Big data.
En conséquence, le métier de data scientist est amené à évoluer. A noter que face à l’apparition de nouveaux algorithmes et de solutions Open Source, il y aura probablement une forte recrudescence des techniques classiques de statistiques et de probabilité, que l’on peut parfois oublier en data science. Se tourner directement vers des algorithmes complexes n’est pas toujours la bonne solution, notamment en maintenance prédictive où l’usage de la loi de Poisson ou de la chaîne de Markov peut suffire dans certains cas. La création de nouveaux outils est en partie due aux communautés de data scientists, très actives, qui nous permettent de partager des retours d’expérience et d’enrichir les travaux des uns et des autres.
De plus, les frontières entre les directions IT et les métiers vont être amenées à s’effacer. Les data scientists devront donc faire la passerelle entre ces deux visions de l’entreprise et se spécialiser pour répondre aux besoins de leurs clients.
Les data-scientists sont, aujourd’hui, extrêmement recherchés et encore trop rares. Nous assistons, en conséquence, à une bulle qui est en train de se former sur les domaines de la data science. Toutefois, ce métier va se démocratiser grâce à la demande constante des entreprises, au changement de culture des nouvelles générations mais aussi grâce à l’apparition des "citizen data scientists"[1]. Annoncés par le Gartner[2], ils ont pour particularité d’effectuer des analyses sans disposer de compétences avancées. Complémentaires à notre métier, ils vont ouvrir des portes aux data scientists, qui seront toujours indispensables pour arriver à un produit abouti.
[1] Gartner définit un « citizen data scientist » par « a person who creates or generates models that use advanced diagnostic analytics or predictive and prescriptive capabilities, but whose primary job function is outside the field of statistics and analytics. »