Les nouvelles méthodes de continuité de l’activité et de reprise après sinistre

Alors que les initiatives de reprise d’activité ne datent pas d’aujourd’hui, ce n’est que récemment que de nouvelles technologies ont changé la façon d’aborder les problématiques liées à la reprise après sinistre et à la planification de la continuité de l’activité.

Aujourd’hui, dans un contexte de nouvelles réglementations concernant la protection des données et la reprise après sinistre, le responsable de l’informatique doit être prêt à tout, même à l’inattendu.

Alors que les initiatives de reprise d’activité ne datent pas d’aujourd’hui, ce n’est que récemment que de nouvelles technologies ont changé la façon d’aborder les problématiques liées à la reprise après sinistre et à la planification de la continuité de l’activité.

Ces technologies se basent sur l’optimisation des réseaux étendus (WAN), la redirection du trafic, la réplication des données et l’accès sécurisé à distance, offrant une approche méthodique aux entreprises qui veulent consolider leurs coûts et leurs équipements, accélérer l’administration et s’assurer que leurs applications sont toujours disponibles, même en cas de sinistre.


Les objectifs de délai et de point de récupération

L'objectif de délai de récupération (RTO, pour Recovery Time Objective) est le délai maximal d'interruption avant la récupération des systèmes, des applications et des fonctions. Le RTO est la base du développement de stratégies efficaces de reprise, ainsi que pour déterminer où et comment mettre en oeuvre ces stratégies lors d'un sinistre.

Le point de récupération définit, par exemple, les données les plus récentes après un sinistre. L'objectif de point de récupération (RPO, pour Recovery Point Objective) constitue le point dans le temps auquel les systèmes et les données seront restaurés après une interruption.

Le RPO est donc lié à la quantité maximale de données qu'une entreprise accepte de sacrifier suite à un sinistre. S'il est défini à zéro, la solution de continuité de l'activité peut traverser un sinistre sans perdre aucune donnée.

Le RTO et le RPO représentent une cible concrète pour une solution de continuité d'activité et de reprise après sinistre. Leur amélioration impose d'augmenter les investissements en matière de processus et de technologies de stockage et de réseau.

La possibilité d'approcher d'un RPO égal à zéro dépend également de la distance entre les centres de données, et de la tolérance des applications à la latence du réseau. C'est pourquoi il est important de limiter les RTO et RPO à un niveau que l'entreprise peut tolérer.

Zone sinistrée


L'étendue probable d'un sinistre, appelée zone sinistrée (ou rayon du sinistre), influe également sur la solution de continuité de l'activité. La probabilité et l'étendue des dommages résultant de tremblements de terre, d'inondations, d'incendies, de tornades, de cyclones ou encore d'attaques terroristes varient en fonction de la région où se trouve le centre de données. Pour être efficace, le centre de secours doit se trouver à l'extérieur de la zone sinistrée.

La détermination de la zone sinistrée peut cependant s'avérer plus difficile que l'identification d'une zone géographique. Par exemple, un tremblement de terre peut détruire en même temps les centres de données secondaire et primaire, si tous deux se situent sur une ligne de faille majeure.

En ce sens, beaucoup d'entreprises appliquent une stratégie à plusieurs relais, avec deux centres de données largement séparés au niveau national, et un troisième site dans une autre région du monde.

Planification de la continuité de l'activité


Une étude réalisée par IDC en 2004, ainsi qu'une étude récente, soulignent la persistance d'une tendance parmi les entreprises qui cherchent à réduire les périodes d'arrêt et à augmenter leur disponibilité globale. En ce qui concerne la continuité de l'activité, la période d'arrêt a diminué de plus de 53 % en quatre ans, passant de 20,4 heures en 2003 à 9,5 heures en 2007.

Cette évolution se traduit par une progression de la disponibilité, qui passe de 97,2 % à 98,7 %. Au niveau de l'impact sur les résultats de l'entreprise, le fait d'ajouter près de 11 heures par mois de disponibilité équivaut à 132 heures sur l'année, soit 5,5 jours de 24 heures. Une société ne pouvant assurer cette disponibilité supplémentaire risque ainsi de perdre le chiffre d'affaires correspondant à cette période d'activité.

En outre, si une entreprise compte améliorer la disponibilité de son environnement informatique et de ses processus métier, elle devra intégrer et utiliser des méthodes plus sophistiquées. Pour atteindre ces objectifs de haute disponibilité, il lui faudra probablement davantage d'expertise, d'automatisation et, au final, d'investissements.

Planification de la reprise après sinistre


Un plan de reprise après sinistre couvre les données, le matériel et le logiciel qui sont essentiels à la reprise de l'activité du fait d'un sinistre d'origine naturelle ou humaine. Il doit également prendre en considération la perte soudaine ou inattendue de protagonistes importants au sein du personnel de l'entreprise.

La phase d'analyse du développement d'un plan de continuité de l'activité s'attache à l'impact et aux menaces potentiels d'une part, à divers scénarii d'impact d'autre part, et résulte dans la production d'une documentation des exigences du plan de continuité.

  • Analyse de l'impact :

    Il s'agit de distinguer au sein de l'organisation les fonctions critiques de celles qui ne le sont pas. Une fonction est considérée comme critique dès lors que son indisponibilité et les dommages qui en résultent ne peuvent en aucun cas être envisagés. Le seuil d'acceptabilité peut varier en fonction du coût de mise en place et de maintien de l'activité appropriée ou des solutions de reprise. Une fonction peut aussi être critique par obligation légale.

    Enfin, l'analyse de l'impact aboutit aux exigences de reprise pour chaque fonction critique.

  • Analyse des menaces :

    Une fois définis les besoins en matière de reprise, il est conseillé de documenter les menaces potentielles, afin de préciser les étapes spécifiques à un sinistre donné. Voici quelques-unes des menaces les plus fréquentes : catastrophes naturelles, incendies, pannes de courant, attaques terroristes, interruptions organisées ou délibérées, panne du système et/ou des équipements, erreurs humaines, virus informatiques, problèmes d'ordre légal, grèves, etc.

  • Analyse des scénarios :

    À l'exception des maladies, toutes les menaces citées ci-dessus ont un impact commun : les dommages occasionnés à l'infrastructure de l'organisation. L'impact de la maladie, initialement au niveau humain, peut lui aussi être géré par des solutions techniques et professionnelles.

    Ainsi, lors de l'épidémie de SRAS en 2002-2003, certaines entreprises ont scindé leurs équipes en deux et les ont réparties, de façon alternée, entre le site principal de travail et le site secondaire, avec une fréquence égale à la période d'incubation de la maladie.

    Elles ont également interdit les rencontres entre les membres des deux équipes, aussi bien pendant qu'en dehors des heures de travail. En procédant ainsi, elles ont limité l'impact des mesures de quarantaine imposées par le gouvernement lorsqu'un membre d'une équipé contractait ou était exposé à la maladie.


    Consolidation de serveurs et de centre de données

    La consolidation de centre de données vise à optimiser les technologies présentes dans un ou plusieurs centres de données, afin de réduire les coûts, d'améliorer les performances et de limiter les risques. Cette approche implique la planification, l'optimisation et la migration concrète des systèmes et des installations.

    Le centre de données et le dilemme du stockage des données :

    Une récente étude conduite par l'institut californien Strategic Research Corporation a révélé que 60 % des informations d'une entreprise sont conservées hors de son centre de données, et sans protection pour 75 % d'entre elles.

    L'étude souligne les dangers de cette pratique, car ces données « périphériques » peuvent être aussi essentielles à la survie de l'entreprise que des données centralisées, gérées de plus près. L'un des problèmes les plus sérieux lié au système d'information a été de trouver une méthode efficace pour protéger les données présentes dans les bureaux éloignés. Parmi les principaux problèmes dans de domaine, citons :

    Le coût élevé de la maintenance des systèmes à bande :

  • le matériel et le logiciel, qui peuvent aller de 5 000 à 20 000 dollars, voire plus ; 
  • le maintien des équipements de sauvegarde à distance ;
  • les services tiers pour gérer les bandes et le processus de sauvegarde.

    Des procédures hétérogènes de sauvegarde :

  • les employés des bureaux éloignés ne sont pas forcément des professionnels de l'informatique ; 
  • du fait qu'ils occupent déjà des fonctions à plein temps, ils peuvent ne pas toujours être en mesure d'appliquer les procédures de sauvegarde de façon régulière. 

    La difficulté de mise en oeuvre une sauvegarde sur le réseau :

  • liaisons WAN trop lentes ;
  • trop grandes quantités de données dans les serveurs éloignés ;
  • la sauvegarde par le réseau encombre ce dernier, ce qui ralentit les serveurs d'applications. 

    Les principales raisons de procéder à la consolidation des serveurs :

  • améliorer le coût total de possession (TCO) et contrôler la prolifération des serveurs ; 
  • faciliter la gestion quotidienne des mises à jour, des reconfigurations, des correctifs, de l'équilibrage de charge et des sauvegardes, via une utilisation plus efficace des processeurs et du stockage ; 
  • l'administration des divisions incite également à la consolidation. Souvent, les utilisateurs doivent gérer à temps partiel les systèmes distribués, ce qui entraîne leur frustration et diminue leur productivité.


    La réduction du coût total de possession (TCO) reste une raison majeure de la consolidation des serveurs. Les problématiques d'amélioration de la qualité de service, d'administration des systèmes et de réactivité sont en outre de plus en plus prises en considération.

    D'autre part, la croissance incontrôlée du stockage, des durées de rétention plus longues et un faible pourcentage d'utilisation, ont placé le stockage au premier plan des problèmes opérationnels. La consolidation du stockage déplace le problème du serveur vers l'application ou l'infrastructure.

    La consolidation représente une excellente opportunité d'améliorer la productivité du personnel, la gestion des actifs, les niveaux de service et la conformité à des réglementations de plus en plus strictes.

    C'est enfin l'occasion de cesser de se focaliser sur l'infrastructure et de se concentrer davantage sur les services. L'externalisation du stockage élimine quant à elle la lourde tâche de mise à niveau des serveurs équipés d'un stockage interne.

    En conclusion, il faut avant tout s'assurer que les principales motivations d'un projet de consolidation sont bien comprises, de telle sorte que des objectifs adaptés aux besoins soient définis, permettant d'évaluer de façon appropriée et pertinentes les résultats obtenus par la suite.


    Les gestes indispensables pour protéger au mieux le patrimoine applicatif :

    Les applications sont au coeur de l'activité de toute entreprise. Pour assurer la reprise d'applications critiques, certaines mesures peuvent être mises en oeuvre, notamment :

  • répertorier les applications et déterminer pour chacune d'entre elles un RPO et un RTO ;
  • étudier les réponses à donner à une catastrophe environnementale, à l'arrêt des services (internes comme externes) et aux pannes systèmes ;
  • désigner un responsable de l'application des plans de reprise après sinistre et de continuité de l'activité ;
  • informer et former le personnel au plan de continuité de l'activité ;
  • documenter le plan de continuité de l'activité et en conserver une copie dans un emplacement distinct ;
  • tester le plan de reprise après sinistre, les sauvegardes et les restaurations, pour s'assurer que tout fonctionne correctement ;
  • procéder régulièrement à des évaluations et à des révisions du plan.