Donner de la valeur à nos données de santé, c'est améliorer la santé publique !

Lorsque l’on songe à l’évolution subite de certaines formes de grippe, de chikungunya, ou encore à la progression de la dengue, il apparaît urgent de déployer, au-delà des dispositifs de surveillance actuels tels que GrippeNet.fr ou sentiweb, une forme de contribution individuelle destinée à parfaire nos connaissances sur la diffusion de ces maladies.

L’analyse de tendances sur les épidémies est, pour la majorité, associée aux requêtes et mots clés soumis aux moteurs de recherches sur Internet, ou encore aux données exposées sur les réseaux sociaux tels que Twitter et Facebook. Ce serait réducteur de considérer deux approches qui ne seraient pas complémentaires.

Ces sources de données ne peuvent être ignorées car elles constituent une source contribuant à la pertinence des modèles d’analyses prédictives et viennent compléter les sources de données traditionnellement utilisées telles que les données démographiques, de prescriptions, de pharmacovigilance, mais aussi les études cliniques ou encore les prévisions météorologiques.

Si ces données tirées des réseaux sociaux ne suffisent pas à développer un modèle permettant d’identifier une épidémie, elles sont en revanche un apport essentiel de la dimension « Big » de la donnée et viennent offrir de la perspective aux données traditionnelles.

La véritable valeur de ces données réside dans la capacité des entreprises à faire résonner une variété de sources de données entre elles, à disposer d’une profondeur d’historique et d’une information granulaire.

Comme le mentionne Ylana Chalem, Directrice Associée et expert en statistique d’Inférential, cabinet spécialisé dans les études épidémiologiques et de l’économie de la santé : « L’analyse avancée est ainsi basée sur le décloisonnement des données et des méthodes analytiques permettant de prédire l’occurrence d’évènements en tenant compte d’un nombre important de paramètres ».

Aussi, l’éco-système analytique doit être agile, adaptable, en capacité de collecter en continu des informations, de prendre en compte non plus des sous-ensembles, comme c’est le cas aujourd’hui, mais des jeux de données complets. Il doit aussi permettre d’enrichir en pertinence le patrimoine de connaissances existantes sur le sujet choisi, et d’en étendre ou restreindre son périmètre dès que l’intérêt est avéré.

Les modèles mis en œuvre par lune dynamique d’intelligence collective entre les analystes métiers, les data scientists et les « informa-tisticiens », ont ceci d’intéressants qu’ils apprennent des données qui les nourrissent. En clair, plus vous disposez de données, plus le modèle prédictif tend à s’améliorer.

L’usage des Big data offre indéniablement de nouvelles perspectives analytiques aux chercheurs. Pour preuves, la nombre croissant d’annonces formulées par les laboratoires pharmaceutiques et les universitaires sur le nombre d’expérimentations ou encore la création de méga bases de données telle que canSAR (dédiée à la connaissance sur les traitements anticancéreux), HealthData.gov (mettant à disposition des données à valeur ajoutée auprès des acteurs de la santé), le Système national d'information inter-régimes de l'Assurance maladie (SNIIRAM) en France, Care.data en Grande Bretagne ou encore la base géante Precision Medecine Initiative lancée en février dernier par Barack Obama, autour de la médecine personnalisée. Impossibles à concevoir il y a encore dix ans, ces possibilités ne relèvent pas de la science-fiction. Elles sont ancrées dans l’économie réelle.

Pour autant, beaucoup ne savent encore pas comment employer le big data, comment le connecter avec un véritable enjeu métier.

L’intégration des données du monde réel (demande de remboursements d’assureur ou encore enregistrements d’actes médicaux anonymisés ou pseudonymisés), avec les données épidémiologiques et les données cliniques ouvrent des horizons aux acteurs de la santé. Ceux-ci peuvent ainsi comparer la réponse aux différentes options d’un traitement par rapport à des groupes de patients (âge, genre, conditions médicales pré-existantes), procéder à une surveillance active des effets secondaires, identifier les utilisations hors indications ou encore assurer le suivi dans le temps des résultats découlant de la prise d’un médicament.

Le big data ou « La donnée en réalité augmentée ! ».

Mettre en valeur des données de santé gisantes, c’est donc contribuer activement à une amélioration de la santé publique. En 2014, le ministère de la santé malais en collaboration avec des universitaires malaisiens ont ainsi contribué au développement d’un index de prédiction de la dengue en mixant de nombreuses sources issues des open data et des données traditionnelles. Cet index de prédiction du risque (sur une échelle croissante de 1 à 5) présente un taux de précision de 85% sur 2 à 4 semaines. Les résultats sont mis à disposition dans une application cartographique, géo-localisant au quartier les différentes zones à risques et offrant des services d’alerte via un compte Twitter aux citoyens et aux touristes.

Ce n’est là qu’un exemple de la rupture générée par l’usage des big data. Pour la santé de tous, ce savoir-faire ne demande qu’à être dupliqué.

Donner de la valeur à nos données de santé, c'est améliorer la santé publique !

Guides

Repères