IA : l'impact du biais du survivant
Qu'est-ce que le biais du survivant ? Ce problème impacte les projets d'IA lorsque les entreprises traitent des données partielles ou si le processus d'acquisition a éliminé une partie des informations.
Les origines du biais du survivant
Il tient son nom d’un épisode de la seconde guerre mondiale, alors que l’armée américaine cherchait à assurer la protection de ses pilotes. Elle voulait identifier les failles de ses avions afin de mieux les renforcer, sans pour autant les alourdir. La position des impacts de balles sur chacun de ses avions a ainsi été étudiée et analysée. A chaque atterrissage, l’armée a noté les positions précises des balles afin d’établir un schéma. Il est alors apparu que les impacts n’étaient pas distribués de manière uniforme, étant principalement concentrés sur le bout des ailes, le centre de l’appareil et la queue de l’avion. Si la conclusion initiale de renforcer les zones visiblement exposées en y ajoutant un blindage apparaissait comme évidente, Abraham Wald, un mathématicien américain la réfute. Selon lui, cette répartition des impacts et les explications subséquentes étaient incomplètes : en effet, seuls les avions qui atterrissaient faisaient l’objet d’observations, les autres, abattus par l’impact d’un projectile, ne pouvaient pas être analysés. Pour Wald, ce sont donc les parties sans impact qui devaient être renforcées.
La transcription à l'intelligence artificielle
Le biais du survivant se transcrit aujourd’hui aux projets d’intelligence artificielle. La perte d’informations au fil de l’acquisition des données est un phénomène courant qui peut impacter les projets d’automatisation si l’on ne supervise pas le processus d’acquisition et sa performance.
Un exemple probant de cette situation est l’automatisation d’une décision d’achat. Lorsqu’un acheteur va sélectionner un fournisseur parmi de multiples devis, il cherche à minimiser ses risques et ses dépenses au fur et à mesure. Est-il possible de tirer des conclusions immédiates de l’historique de ses choix pour automatiser la sélection du meilleur fournisseur ? Comment identifier et évaluer les solutions qu’il aurait peu exploré par le passé et dont les conséquences sont encore méconnues ?
Heureusement, il existe des méthodes qui permettent de contourner cette difficulté. Lors de l’automatisation d’un achat par exemple, on peut attribuer une note d’opportunité aux différentes options et tester occasionnellement les moins avantageuses. Ainsi, les données sur les options jugées moins performantes seront collectées occasionnellement. Il devient possible de s’assurer que l’évaluation est toujours correcte et en apprendre davantage sur le réel.
Le biais du survivant illustre l’importance d’encourager et planifier les échanges entre une équipe de data-scientists et les métiers qu’ils adressent, afin de tirer les meilleures conclusions et d’assurer la performance d’une IA en production.