Dans deux chroniques précédentes, j'ai donné plusieurs exemples de feature engineering, le principal levier d’action du data scientist pour obtenir la qualité désirée.
Sans les données brutes et les informations qui s’y cachent, les meilleurs algorithmes de machine learning ne peuvent rien. Entre elles et ces algorithmes, un travail de feature engineering doit être réalisé.
Le feature engineering renvoie à l'ensemble des interventions effectuées sur les données brutes avant qu'elles ne soient prises en compte par un algorithme apprenant.