Données synthétiques : un nouveau levier stratégique pour l'assurance
Face à l'explosion des menaces numériques et l'augmentation des risques climatiques, les assureurs capitalisent de plus en plus sur l'IA pour mieux appréhender les risques et lutter contre la fraude.
Mais dans un contexte réglementaire de plus en plus strict, notamment avec le RGPD et l’EU AI Act en Europe, ainsi que l’action de l’ACPR (L'Autorité de contrôle prudentiel et de résolution) en France, l’accès fluide aux données réelles reste un défi majeur. C’est là où les données synthétiques jouent un rôle majeur.
Une réponse aux défis d’accès et de gouvernance des données
Vous pensiez que les assureurs disposaient d'une abondance de données sur leurs utilisateurs et sur les différents risques auxquels ils font face ? La réalité est plus complexe. Si la donnée existe, l’enjeu réside dans sa gouvernance, son accessibilité et son exploitation. En effet, malgré d'importants investissements de modernisation engagés depuis près de dix ans, les sociétés d’assurance doivent toujours composer avec des infrastructures informatiques historiques (legacy systems) qui freinent la circulation fluide de l'information. De plus, les réglementations européennes et françaises, RGPD, droit à l'oubli et exigences spécifiques de l'ACPR, imposent des contraintes fortes, particulièrement sur l’usage des données sensibles en santé. Heureusement, les données synthétiques permettent de contourner ces obstacles. Générées artificiellement à partir de modèles statistiques et de Machine Learning, elles reproduisent fidèlement les caractéristiques de données réelles sans pour autant exposer d’informations sensibles. D’ici 2027, IDC prévoit que 40 % des algorithmes utilisés dans l’assurance intégreront systématiquement des données synthétiques (1).
Optimiser la détection de fraude et anticiper les risques
Avec 695 millions d’euros de fraude totale identifiée en 2023 (2), la fraude aux assurances est un fléau en constante évolution. Selon la Fédération Française de l'Assurance, elle représente près de 10 % des indemnisations versées chaque année dans le pays (3). Afin d’améliorer la capacité de détection des fraudes en temps réel, un enjeu majeur pour limiter les pertes financières, les données synthétiques permettent d’entraîner des modèles d’IA sur des volumes massifs de scénarios, réels ou inédits. Les assureurs peuvent ainsi simuler des millions de demandes d’indemnisation. Ils sont alors en mesure de repérer des schémas anormaux, attribuer des scores de risque et déclencher des analyses approfondies, avant même que la fraude ne se réalise.
Mieux appréhender les nouveaux risques climatiques
Autre sujet de préoccupation pour les assureurs, la crise climatique. Face à cet enjeu majeur, qui bouleverse les portefeuilles d’assurance, une refonte totale de l’évaluation des risques est indispensable. Sécheresses, inondations, tempêtes : les phénomènes météorologiques extrêmes ont été multipliés par 2 en 20 ans selon l'ONU (4). En conséquence, les données historiques ne suffisent plus pour appréhender et anticiper ces risques inédits. Or, la mutualisation des données entre assureurs — prônée par le rapport Langreney mandaté par le gouvernement français — reste difficile à mettre en œuvre. Les données synthétiques offrent ici une alternative précieuse : elles permettent de simuler des événements extrêmes dans des zones géographiques où les portefeuilles réels sont encore peu exposés. Cette approche aide les assureurs à mieux modéliser les impacts climatiques sur leurs engagements futurs.
Précautions à prendre et facteurs de succès
Si les avantages sont nombreux, plusieurs écueils doivent être évités. Les données synthétiques restent dépendantes de la qualité des données réelles utilisées en amont. Sans travail préalable sur la correction des biais, le risque est réel de reproduire et amplifier les erreurs existantes. C’est le fameux adage « garbage in, garbage out » : une IA, même puissante, n’aura de valeur que si elle est alimentée par des données de qualité. Pour réussir, il est crucial d’adopter une approche structurée autour du triptyque “valeur, gouvernance, technologie”. Chaque projet doit s’appuyer sur des cas d’usage clairement identifiés (lutte contre la fraude, modélisation climatique, amélioration de l’expérience client…) et veiller à équilibrer les exigences de conformité, d’éthique et de performance. Enfin, démocratiser l’usage des données synthétiques au sein de toutes les fonctions métiers — de la souscription à l’indemnisation — permettra de favoriser leur adoption et de maximiser leur impact. C’est la raison pour laquelle les plateformes de génération de données synthétiques doivent être accessibles non seulement aux data scientists, mais aussi aux actuaires, aux gestionnaires de sinistres et aux directions métiers.
Au fur et à mesure de l’entrée en vigueur des nouvelles réglementations sur les données, les exigences de transparence, d’éthique et de souveraineté s'accentuent. Les assureurs qui auront su prendre le virage de l’IA et de la donnée synthétique seront mieux armés pour répondre aux défis de demain. Plus largement, les données synthétiques sont devenues un levier stratégique essentiel pour la résilience, la compétitivité et la survie du secteur assurantiel.
(1) IDC Futurescape : Wordwlide Insurance 2024 predictions – Asia/pacific (excluding Japan) implications
https://my.idc.com/getdoc.jsp?containerId=prAP52003124&utm
(2) Etude ALFA (Agence de Lutte contre la Fraude à l’assurance) pour 2023
https://www.alfa.asso.fr/
(3) Fédération Française de l'Assurance, Rapport 2024 sur la fraude à l’assurance
https://www.ffa-assurance.fr
(4) ONU, 2022 Report on Climate Disasters : https://www.un.org/en/climatechange