Data & Covid 19 : quelques enseignements sur les KPI sanitaires

La crise actuelle amène à reconsidérer tous les indicateurs de performance, qu'il s'agisse des volets sanitaire et macroéconomiques, comme du pilotage de l'entreprise.

Il y a en ce lundi 6 avril, date de rédaction de cet article, 942 729 malades du Covid-19 officiellement répertoriés à l’échelle mondiale, 260 012 individus guéris et 69 374 décès des suites du virus (1). Des chiffres, des données, des indicateurs, la plupart des articles de presses publiés au cours des six dernières semaines font étalage de données quantitatives sur l’épidémie. Jamais, un phénomène épidémiologique n’a été autant documenté. La population confinée se transforme en apprenti(es) statisticien(nes) suivant au jour le jour la progression du nombre de cas sur le territoire français, par région, par pays et s’interroge : pourquoi tant de morts en Italie ? Pourquoi si peu en Allemagne ? Peut-on réellement croire en une maîtrise de l’épidémie en Chine ? Quand verra-t-on les effets du confinement ?

Un premier point à rappeler est que derrière ces 69 374 décès se trouvent autant de drames familiaux et individuels et une réalité humaine que la déferlante de l’information en continu, tout en favorisant la montée de l’anxiété, ne permet plus de concrétiser. Une jeune fille de 16 ans décédée des suites du coronavirus émeut ; 8 093 morts semblent malheureusement bien plus abstraits. Et que dire quand un autre journal rappelle qu’une grippe saisonnière tue dans l’indifférence 10 000 à 15 000 personnes par an en France (2).

En faisant le choix de mettre en pause pour le temps d’un article cette vision “empathique” de l’épidémie, nous pouvons reconnaître dans le désarroi de la population face à la déferlante chiffrée, des interrogations communes aux clients que nous accompagnons sur des projets de pilotage et de refonte de leurs indicateurs de performance. Au cours de cet article, nous explorerons les thématiques et axes d’analyse les plus fréquemment rencontrés dans les communications institutionnelles et médiatiques et nous interrogerons sur les indicateurs présentés.

Le premier axe d’analyse et de loin le plus suivi concerne la prévalence de l’épidémie. Les indicateurs les plus souvent communiqués (notamment dans le cadre des points journaliers du gouvernement français) concernent le nombre de cas cumulés détectés sur le territoire français et le nombre de décès dûs au Covid-19. Ces indicateurs permettent-ils de donner une photographie de l’épidémie à date ? La réponse est non et les raisons en sont multiples : politique de dépistage non systématique (en EHPAD, seuls les deux premiers cas suspects font l’objet d’un test), part de porteurs asymptomatiques non connue, tests post-mortem également non systématiques, hétérogénéité dans l’attribution des décès au Covid-19 dans le cas de comorbidités avérées. Il n’est donc pas possible à date de connaître réellement le nombre de contaminés sur le territoire français, mais uniquement le nombre de cas graves détectés par test PCR. Ces indicateurs ont donc une pertinence faible en valeur absolue et ne peuvent être utilisés qu’en valeur relative… en admettant que la politique de test soit constante. En Chine, la modification des règles de comptage le 13 février a entraîné un rebond du nombre de nouveau cas à près de 15 000 versus une tendance à 5 000 / jour dans la semaine précédente. Comptabiliser le nombre total de cas graves ne permet donc pas de comprendre la portée de l’épidémie sur un territoire. Cet indicateur en revanche est précieux pour les médecins et les services de santé dans une vision plus opérationnelle de “supply chain/logistique”. Connaître le nombre de nouveaux cas graves permet d’estimer le nombre de lits d’hospitalisation à consacrer aux malades du Covid-19 et d’anticiper des montées en charge sur les services de réanimation. Un indicateur qui n’a ainsi que peu de sens pour la population devient précieux dans la lutte contre l’engorgement des services hospitaliers et le déploiement de nouveaux lits. En France, afin d’aller plus loin que cette vue restrictive des cas contaminés, de nouveaux indicateurs apparaissent depuis quelques jours comme le nombre d’appels au SAMU et à SOS médecin pour suspicion d’atteinte par le Covid-19.  Avec quelques semaines de recul, il sera également possible d’évaluer la surmortalité (par rapport à une base historique) sur la période d’épidémie et d’en déduire de manière statistique l’impact réel du covid sur le nombre de décès. Une première estimation sur la semaine 12 fait état d’une hausse de 9% à l’échelle nationale (3).

“Côté mortalité, l’Italie enregistre le plus lourd bilan de tous les pays touchés” (4), en temps de crise, un réflexe commun est celui de la comparaison. La France s’en sort-elle mieux que les autres pays ? Allons-nous connaître le même sort que nos voisins transalpins ? A date, ont été recensés près de 2 fois plus de décès en Italie qu’en France (15 887 versus 8 093). Mais l’épidémie y est plus ancienne. Comme le montre l’analyse réalisée par Les Décodeurs du Monde , en prenant comme point de départ de l’analyse le jour du 10ème décès attribué au Covid-19, à +29 jours (qui correspond à ce lundi 6 avril en France) il y avait 7 503 morts comptabilisés en Italie, soit 7% de moins qu’en France aujourd’hui. Il y a donc un facteur temporel à prendre en compte pour commencer. Par ailleurs, la taille de la population est également à mettre en regard du nombre de cas. Si les cas italiens et français sont relativement comparables en termes de volumétrie de population (60-67 millions d’habitants), il est difficile d’y comparer un nombre de cas détectés en Chine ou aux Etats-Unis. Pourtant nombreux sont les cas de représentation visuelle comparant ces pays.  Seule l’infographie Worldometer (5) fournit à notre connaissance des indicateurs comparables de nombre de cas / nombre de décès pour 1 million d’habitants. Au-delà même de ces facteurs très simples à comprendre et pour faire le lien avec notre premier paragraphe, les points suivants rendent difficile la comparaison entre pays :

  • Les caractéristiques géographiques avec les densités d’habitants qui donnent une lecture d’un risque accru de propagation en ville par comparaison à des zones rurales
  • Des politiques de tests différenciées entre pays (tests systématiques en Corée du Sud par exemple contre tests sur cas graves uniquement en France)
  • Des caractéristiques socio-démographiques et culturelles différentes. En Italie et en Asie, rares sont les personnes âgées résidant en EHPAD. Elles demeurent le plus souvent dans leurs familles respectives. On ne se salue pas de la même manière en Espagne et au Japon… En Asie le port du masque et notamment depuis l’épisode du SRAS est rentré dans le quotidien.
  • Des systèmes de santé différents dans leur fonctionnement et leurs performances qui ont un impact direct sur la perception de létalité du virus. En Italie toujours, les régions du Sud anticipaient de plus grandes difficultés à faire face au virus que les régions considérées comme moteurs économiques du Nord. Aux Etats-Unis où la condition d’admission en soins dépend de la capacité du malade à cotiser pour une assurance santé, l’impact sanitaire pourrait être plus fort qu’en France.

Mettre tous les pays dans un même “panier statistique” aux seules fins de comparaison du nombre de cas / nombre de décès peut donc être sujet à débat. La comparaison de l’évolution des courbes de l’épidémie d’un pays à l’autre peut en revanche permettre d’évaluer l’efficacité des mesures de confinement et d’adapter les restrictions localement sur la base des enseignements d’autres régions ou pays.

Au delà des données de prévalence et de propagation se pose la question des caractéristiques du virus qui elles-mêmes déterminent sa capacité à pénétrer une population. En quoi cette épidémie diffère-t-elle de la grippe saisonnière ? Suivre ici un indicateur de nombre de décès brut est peu pertinent, la grippe “usuelle” tuant chaque année environ 10 000 à 15 000 personnes en France (calculée par excès de mortalité) et jusqu'à 650 000 personnes dans le monde. Les véritables indicateurs de “virulence” du Covid-19 sont au nombre de deux : son taux de létalité et son taux de reproduction.

  • Le taux de létalité correspond au total des décès divisé par le total des contaminés. A cet effet, plusieurs questions peuvent être soulevées. Au numérateur : comment être certain qu’un décès est à “attribuer” uniquement au Covid-19 et non à d’autres morbidités ? Au dénominateur : le nombre de cas détectés est directement lié à la politique de test du pays en question, expliquant des différentiels de mortalité allant de 11% en Italie à 1% environ en Allemagne. Si tous les porteurs sains et toutes les personnes atteintes de symptômes bénins sont testés, mécaniquement le taux de létalité apparent diminue. Par ailleurs, si l’on teste dans l’objectif de déterminer l’atteinte des 60% de contaminé permettant une immunité collective, l’on trouvera plus de positifs que si l’on teste avec l’objectif de traiter les cas atteints. Communiquer un taux de mortalité global à l’échelle d’une population peut par ailleurs manquer de pertinence lorsque celui-ci oscille entre 0,5% et 15% en fonction de l’âge de la personne atteinte et de ses antécédents médicaux (le taux de létalité estimé sur les individus diabétiques6 est par exemple estimé à 9,2% contre une moyenne située entre 2 et 3,5%). En Italie, l’âge moyen des personnes décédées était de 79,5 ans (7), donnée rarement communiquée.
  • L’indice de contagiosité ou taux de reproduction permet quant à lui d’estimer la vitesse de propagation du virus : il indique le nombre de personnes qu’un infecté peut contaminer. Un R0 = 3 signifie qu’une personne contaminée en contaminera 3 qui elles-mêmes en contamineront 3, le virus se développant dans la population selon une loi exponentielle. Ces indicateurs ne doivent pas être suivis à l’échelle individuelle ; “en étant contaminé, j’ai 3% de chances de mourir et je vais contaminer 3 personnes”. Ils servent essentiellement à la construction de modèles statistiques permettant d’évaluer la date et le nombre de cas du pic épidémique et à ajuster les politiques d’endiguement associées (durcissement ou relâchement du confinement).
  • Sur la base de ces deux indicateurs, la comparaison avec la grippe saisonnière change de visage : taux de létalité entre 2% et 3% (avec un doute sur la comptabilisation des porteurs sains au dénominateur => le taux de létalité du coronavirus en Allemagne oscille autour de 0,7 %, alors qu’il atteindrait environ 4 % en France et 8 % en Italie (8)) contre 0,1% pour la grippe, taux de reproduction entre 1,5 et 3,5 contre 1 pour la grippe saisonnière (9)

Enfin, le virus, phénomène par essence purement biologique, est vécu à travers le prisme des perceptions individuelles et sociales . Il existe donc des indicateurs “connexes” à ceux directement liés au virus qui témoignent de la situation vécue. Ainsi l’on observe que si moins de 50 % des sondés se déclarent préoccupés par l’épidémie en janvier 2020, ils sont 85 % au 25 mars de la même année, cette hausse de l'inquiétude étant corrélée à l’augmentation du nombre de cas (10). Parallèlement, 87% des français sont favorables à un durcissement des mesures de confinement (11). L’inquiétude et la perception de gravité sont donc corrélées à l’acceptation globale de la restriction de liberté indue par la lutte contre l’épidémie. On peut donc s’interroger sur la volonté politique derrière certaines communications, l’accent mis par exemple dans les médias sur les cas de décès de “personnes jeunes et sans antécédents” pouvant servir à contrer le sentiment d’invulnérabilité de certaines classes d’âges peu scrupuleuses dans le respect des règles de confinement dans les premiers jours de leur promulgation.

La pandémie de Covid-19 représente un événement sans précédent dans toutes les démocraties occidentales et bouleverse le quotidien de près de la moitié de l’humanité à l’heure même de rédaction de cet article. Il est toutefois nécessaire, face à l’afflux d’informations et de données de ne pas perdre de vue les réflexes acquis dans nos métiers analytiques et de continuer à interroger le sens des indicateurs communiqués et les objectifs qu’ils servent. Nous verrons dans la seconde partie de cette série dans quelle mesure ce modèle de réflexion peut être appliqué à deux autres sujets liés à cet épisode pandémique : l’impact du Covid-19 et du confinement sur l’économie mondiale et sur le pilotage des entreprises.

Article co rédigé par :

Léa Guyon - Manager

Hamdi Amroun - Lead Data Science

Raphaël Fétique - Directeur Associé 

(1) https://www.lemonde.fr/les-decodeurs/article/2020/02/27/en-carte-visualisez-la-propagation-mondiale

-de-l-epidemie-de-coronavirus_6031092_4355770.html

(2) https://www.pasteur.fr/fr/centre-medical/fiches-maladies/grippe

(3) Allocation Bruno Salomon, dimanche 29 mars

(4) https://www.lemonde.fr/les-decodeurs/article/2020/02/27/en-carte-visualisez-la-propagation-mondialede-l-epidemie-de-coronavirus_6031092_4355770.html

(5) https://www.worldometers.info/coronavirus/6https://fr.statista.com/statistiques/1091585/morts-infections-coronavirus-monde/

(7) https://www.epicentro.iss.it/coronavirus/bollettino/Report-COVID-2019_17_marzo-v2.pdf

(8) https://www.20minutes.fr/sante/2752611-20200401-coronavirus-pourquoi-taux-letalite-aussi-bas-allemagne

(9) https://www.lemonde.fr/les-decodeurs/article/2020/02/20/2019-ncov-un-virus-peu-contagieux-et-dontla-letalite-est-plutot-faible_6030246_4355770.html

(10) https://fr.statista.com/statistiques/1091585/morts-infections-coronavirus-monde/

(11) https://www.europe1.fr/medias-tele/pour-marina-carrere-dencausse-on-a-menti-sur-lutilite-des-masques-pour-une-bonne-cause-3959187