Gestion des incidents : 5 priorités pour élever la stature du Commander

Dans le domaine de la gestion des incidents informatiques, les coordinateurs ou « Incident Commanders » en anglais (IC) occupent un rôle clé, particulièrement dans le contexte DevOps où ils aident à faire face à des défis complexes.

Pour qu’une entreprise soit performante, elle doit développer son savoir-faire en gestion des incidents et être capable de réagir au plus vite quand les systèmes se dégradent de façon imprévue. Avec une bonne gestion d'incident, une entreprise peut réduire considérablement le temps d'interruption ou de dégradation de son activité et atténuer son impact, aussi bien pour ses clients que ses équipes.

La gestion des incidents reste un processus essentiel car leur occurrence est inhérente à la complexité des applications et des systèmes informatiques modernes, malgré toute l’attention portée à la résilience des architectures, à l’automatisation des déploiements, à la qualité du code et des pratiques DevOps, ou à la compétence des ingénieurs de fiabilité (SRE). A fortiori, lorsqu’un service se dégrade, les causes sont souvent d’autant plus complexes et les actions de remédiation plus délicates à exécuter que par le passé. Le "Incident Commander" est l’une des approches pratiques que de plus en plus d'entreprises adoptent pour adresser cette complexité.

Lors d’un incident, le rôle d'IC ne revient pas à une seule fonction, mais est généralement endossé explicitement par une personne qui y a été formée et qui est en première ligne de la réponse à l’incident, qu’elle soit dans les opérations, un SRE, un développeur ou un responsable produit. En fonction des compétences et de la durée de l’incident, une rotation du rôle peut être nécessaire et les incidents les plus critiques sont parfois assignés à un groupe d’ICs spécialisés, joignables en permanence.

Voici 5 bonnes pratiques permettant d’élever encore la stature du "Incident Commander" pour qu’il garantisse la gestion d'incident la plus efficace possible.

1. Miser sur la coordination

Les incidents sont des évènements sous haute pression : chaotiques, mouvants, complexes et souvent imprévisibles. Parfois, l’information est rare et apparaît peu fiable ; dans d’autres cas, l’équipe est submergée par un flux d’évènements en cascade dont elle peine à formuler la cohérence et la causalité. Dans un tel contexte, un IC qui se positionne comme seul "décideur" ou détenteur des réponses est souvent condamné à échouer, à augmenter les risques, et tend à amplifier le sentiment de panique plutôt que le contenir.

À l’inverse, l’IC qui mise sur ses compétences de coordination est souvent plus performant. Il s’applique à recruter les experts possédant les connaissances et compétences adéquates permettant d’aboutir, en équipe, à un plan d’action efficace. Il s’assure que l’ensemble des collaborateurs dispose des moyens et des informations nécessaires pour accomplir les investigations et mener les actions. Il contient les tensions et favorise une communication claire et régulière. En tant que coordinateur, le responsable de la gestion des incidents est le garant du calme pendant la tempête, un véritable garde-fou contre le stress et la panique amenant à des réactions trop rapides.

En pratique, cela signifie qu’un IC sait formuler les bonnes questions plutôt que de vouloir apporter les réponses, s’assurer que les idées constructives ne sont pas noyées, ou négligées, remettre en question les idées pour évaluer leur pertinence, contrôler les phénomènes d’entrainement et les actions précipitées, et encore orienter l’analyse et la remédiation mais la laisser aux experts.

2. Contrôler le flot d’émotions, d’informations et d’analyse

Les incidents créent un terrain propice au stress, au sentiment de panique et aux réactions non réfléchies. Les IC sont chargés d'identifier ce type d'état et d’aider les collaborateurs à en sortir. Il doivent pour cela être attentifs aux émotions qui se manifestent et ramener au plus vite les collaborateurs qui passent en mode réactif à un état d’esprit calme et recentré.

Les IC doivent également gérer le flot d’informations et comprendre les parties prenantes : qui se trouve dans la pièce, de quelles informations disposent-ils déjà, et quelles sont les informations importantes qui leur manquent ? Le rôle de l’IC consiste donc à écouter, filtrer et agir sur l’essentiel. Faut-il faire appel à une autre équipe, ou bien solliciter l’intervention d’un spécialiste métier pour résoudre un problème spécifique ? C’est souvent lorsque les IC jouent ce rôle d’intermédiaire, en partageant les bonnes informations avec les bonnes personnes que les solutions se dessinent le plus rapidement.

Enfin, les incidents les moins courants sont souvent les plus problématiques et les plus formateurs. Ils sont une opportunité pour les IC de découvrir, en temps réel, à quel point leur représentation mentale d’un système diffère de la réalité ou de celles de leurs collègues. Ils enrichissent l’expérience et les intuitions.

3. Connaître le contexte des incidents sur le bout des doigts

La maîtrise du contexte est essentielle dans le rôle de coordination des IC : elle sous-tend leur capacité à relier des informations entre elles, à identifier des ressources utiles et à repérer d’éventuelles lacunes dans les connaissances et compétences de l’équipe. Il existe trois domaines prépondérants pour une bonne maîtrise du contexte.

Tout d’abord, la compréhension des systèmes techniques et humains de l’entreprise : d’une part l'architecture générale des systèmes, comment s’intègrent ses différents éléments et ses composantes les plus sollicitées ; d’autre part l’organisation, la définition des rôles et des différentes équipes, comment contacter les différents collaborateurs et qui impliquer en fonction de la situation.

Ensuite, la connaissance du processus de gestion des incidents de l’entreprise. S’il ne lui est pas nécessaire de mémoriser chaque élément de procédure en détail, un IC expérimenté développera une forme de mémoire réflexe du cycle de gestion des incidents. Il saura néanmoins accéder rapidement à la documentation de tous les processus et procédures si nécessaire.

Enfin, la compréhension des priorités, de la culture et des méthodes de travail de l’entreprise : pour qu’elle soit efficace, l’IC doit mettre l’accent sur des solutions pratique, dans le respect des habitudes et des capacités traditionnelles de l’entreprise. Plus un IC s’éloigne de ces capacités intrinsèques, plus il lui sera difficile d’organiser et d’exécuter une intervention.

4. Assurer formation et apprentissage continus, identifier les talents et les prédispositions

On ne naît pas "Incident Commander", mais avec une formation adéquate et un apprentissage progressif en situation d’incident, devenir un bon IC est à la portée du plus grand nombre. Toutefois, il faut aussi détecter et encourager ceux qui ont des prédispositions, soit qu’ils assimilent et retiennent holistiquement l’information, ou qu’ils possèdent une grande stabilité émotionnelle pour lutter contre la panique et opérer efficacement en situation de stress ou d'environnements chaotiques.

Certains signes peuvent être révélateurs d’un fort potentiel d’IC. A commencer par l’aisance et la maîtrise technique : un IC doit posséder un vocabulaire technique étendu qui lui permet de comprendre l’essence des conversations, mais aussi pouvoir jauger ses connaissances et savoir 'ce qu’il ne sait pas’. Ensuite, une forme de stabilité et de détachement émotionnel, préalables à la gestion du flot des émotions d’une équipe ; il s’agit d’une qualité précieuse dans le cadre de la gestion des incidents. Et enfin, un enthousiasme naturel pour le poste et les défis à relever : les IC sont motivés par la réussite et ne se focalisent pas sur la possibilité d’un échec, tout en acceptant le fait qu’ils ne pourront pas réussir à gérer la totalité des incidents qu’ils rencontrent.     

5. Rien de tel que la pratique pour se perfectionner

L’entraînement reste, de loin, la meilleure manière pour les IC débutants d’affiner leurs compétences et de gagner en assurance. Plus la session d’entraînement est réaliste, plus l’IC en tirera des bénéfices et pourra évaluer non seulement son potentiel mais également sa capacité à travailler sous pression.

Les entreprises qui réussissent rendent le rôle de l’IC le plus attrayant possible, en récompensant ceux qui ont mené des interventions réussies. Elles mettent en place et favorisent, au sein des équipes de développement, une culture du soutien qui ne rejette pas la faute sur un individu et s’assurent que les IC ne sont jamais pénalisés pour avoir pris une décision difficile. Elles effectuent aussi des revues rétrospectives des incidents pour un apprentissage constant des équipes et une amélioration continue des processus.

La recette d’une bonne gestion des incidents nécessite de nombreux ingrédients. L'un des plus importants est de disposer d’un réservoir d'IC confiants, posés et correctement formés. Enfin, il est capital pour les entreprises de reconnaître et valoriser la contribution stratégique de l’IC, mais également d’investir dans les ressources nécessaires à leur formation et de célébrer leurs plus belles réussites.