Copilotes cliniques : gain de temps ou dette de vigilance ?
Copilotes = heures gagnées si l'on dose l'automatisation : Automatiser le répétitif, Assister le complexe, Réserver à l'humain le critique. Afficher incertitude & sources
Résumés de dossier, lettres, ordonnances types : les copilotes font gagner des heures. Mais plus ils aident, plus on délègue l’attention. Où placer le curseur pour garder le temps gagné… sans le payer en erreurs ?
Quand ça brille à l’écran… et vacille au chevet
Garde du soir. Le copilote rédige une lettre de sortie “nickel” en 20 secondes. En bas de page, une proposition d’antalgiques “standards”. Sauf que le patient est sous anticoagulant : information mentionnée trois paragraphes plus haut, non reprise par l’assistant. Le problème n’est pas “l’IA”, c’est le dosage de l’automatisation. Un copilote performant prépare ; il ne décide pas à notre place. La bonne entrée n’est pas l’outil, c’est le travail réel.
Cartographier les tâches : automatiser, assister, réserver à l’humain
Automatiser (A) : répétitif, règles stables, risque faible.
Ex. mise en forme d’ordonnances standardisées, rappels de vaccins, récupération de résultats, reformulations lisibles pour le patient.
Assister (S) : complexe, décision humaine requise.
Ex. synthèse de dossier, projets de courriers, repérage d’interactions avec lien source, rappel de guidelines.
Humain (H) : ambiguïté clinique/éthique, impact élevé.
Ex. diagnostic différentiel, décision thérapeutique personnalisée, annonce, priorisation d’urgences.
Règle simple : Automatise le répétitif, Assiste le complexe, Abstiens-toi sur le critique.
Traduire ce dosage en RACI (pas à pas, version clinique)
La matrice RACI (Responsible, Accountable, Consulted, Informed) précise, pour chaque tâche, qui réalise (R), qui approuve et répond du résultat (A — un seul), qui est consulté (C) et qui est informé (I), afin de clarifier les rôles et accélérer la décision.
Le RACI clarifie qui fait quoi pour chaque tâche ; il se remplit pendant la planification et se met à jour dès qu’un flux change.
R — Responsible / Réalisateur : exécute la tâche. Ex. le copilote génère le brouillon, l’interne collecte les pièces.
A — Accountable / Approbateur : décide, signe et répond du résultat. Un seul A par tâche. Ex. le clinicien référent valide la lettre/ordonnance.
C — Consulted / Consulté : apporte une expertise, avant la validation. Ex. pharmacien, qualité, cadre de santé.
I — Informed / Informé : doit être tenu au courant. Ex. patient, secrétariat, accueil.
Variante utile : RASCI, où S = Support (ex. data engineer, RSSI, DPO) qui aide R sans décider.
Boîte à outils : Matrice de dosage de l’automatisation (RACI)Listez 10–15 tâches fréquentes, attribuez Automatiser, Assister, Humain puis le RACI (Responsible, Accountable, Consulted, Informed).
Les risques : automation bias, alert fatigue, érosion des compétences
Automation bias : accepter la suggestion “par défaut”.
→ Contre-mesures : double lecture échantillonnée (5–10 %), champ “raison de divergence”, revue pair-à-pair hebdo (30 min).
Alert fatigue : trop d’alertes tue l’alerte.
→ Hiérarchiser (critique/important/info), regrouper, dédupliquer, suivre le ratio signal/bruit.
Perte de compétences : on consulte moins les référentiels, on examine plus vite.
→ Rotations “sans copilote”, drills mensuels, renvois contextuels vers les sources.
Out-of-the-loop : chaîne de raisonnement invisible.
→ Explicabilité (Pourquoi ? Sources ?), incertitude affichée.
Design d’interface : explicabilité, incertitude, versioning
Un bon copilote montre ses limites.
Incertitude visible : score/intervalle + red flags déclenchant l’escalade.
Provenance : bouton “Pourquoi ?” (lignes directrices, extraits surlignés du dossier).
Versioning : modèle/policy affichés, lien “voir diff” entre deux versions d’un courrier.
Édition maîtrisée : surbrillance des ajouts IA, accept/reject bloc par bloc, undo/rollback instantané.
Bouton humain : “Parler au pharmacien/chef de clinique” avec délais.
Procédure de validation clinique (pré-prod → double lecture → rollback)
Pré-prod : définir les métriques avant (exactitude, hallucinations, complétude) + ground truth clinique.
Shadow mode (0 impact) : comparer “ce que l’IA aurait proposé” à “ce qui a été fait”.
Prod limitée + double lecture : 5–10 % des sorties revues par un pair (aléatoire + cas à risque).
Gates de sécurité : drift, explosion d’alertes, temps de correction > X min → rollback automatique.
Post-mortem sans blâme : chaque dérive = correctif (interface, consignes, données).
KPIs qui comptent : temps gagné et erreurs évitées
Temps clinique gagné par type de document (médiane, IQR).
Erreurs/événements évités : interactions détectées, contre-indications repérées.
Taux & nature des corrections humaines (forme vs fond).
Signal/bruit des alertes + taux de dismiss.
Lisibilité patient & satisfaction cliniciens (scores courts).
Visuel : courbe “temps gagné ↑” vs “corrections critiques ↓” au fil des semaines.
Ne “déployez” pas un copilote
Dosez-le. Choisissez une filière, écrivez la matrice Automatiser/Assister/Humain + RACI, lancez un pilote 90 jours (shadow → prod limitée), tenez une revue hebdo des dérives (30 min) et décidez go/adjust/no-go sur deux chiffres : temps gagné & erreurs évitées.