L’heure n’est plus à la reprise après sinistre, mais à la continuité permanente

81% des entreprises déclarent qu’une heure de temps d'arrêt informatique leur coûte en moyenne 300 000 dollars. Les pannes imprévues constituent également le troisième plus grand risque pour les entreprises à l'échelle mondiale.

La panne d’un système informatique est aujourd’hui la principale hantise pour de nombreuses entreprises, quel que soit leur secteur d’activité. Cela n’a rien de surprenant, car 81% des entreprises déclarent qu’une heure de temps d'arrêt leur coûte en moyenne 300 000 dollars ; les pannes imprévues constituent également le troisième plus grand risque pour les entreprises à l'échelle mondiale.

En plus des conséquences financières dues aux temps d'arrêt, l’entreprise peut aussi subir des répercussions à long terme sur sa réputation ainsi que sur la confiance de ses clients pouvant prendre des années avant d’être rétablie.

Les premières générations de gestionnaires de datacenters ont commencé, dans les années 70, à prendre conscience de la dépendance de leur organisation envers les ordinateurs. C'est dans ce contexte qu’est apparue la notion de reprise après sinistre, qui permet de relancer l’activité suite à la défaillance d’une ou plusieurs applications liées au stockage, aux bases de données ou au réseau.

A l’époque, le service informatique devait informer les équipes à chaque interruption en prévenant que "le service de courrier électronique ne sera pas disponible pendant 3 heures le temps que nous rétablissions le système" par exemple, ou que "la base de données des clients ne sera pas accessible ce jour pour que nous puissions augmenter sa capacité…". Dans les années 90, avec le développement d’internet et des technologies, la connectivité et la dépendance des entreprises aux systèmes informatiques s’est accrue.

De nos jours, pour assurer le traitement des données en temps réel, le service informatique doit impérativement assurer un fonctionnement continu. Si des incidents peuvent encore survenir à cause de catastrophes naturelles imprévisibles, comme les tremblements de terre ou les inondations, il est désormais plus probable que les temps d'arrêt surviennent à la suite d’erreurs humaines ou d’évolutions technologiques.

Pour faire face à ces éventualités, deux disciplines similaires ont émergé : la continuité permanente, qui concerne la façon dont l'entreprise peut continuer à fournir ses produits et services en cas d'incident, et la reprise après sinistre, qui mise sur la relance de l'environnement informatique après un problème.

Au début des années 90, alors que le haut débit n’était pas encore répandu ni abordable, les responsables informatiques ont dû construire des répliques redondantes de leurs environnements informatiques, en plus de leurs infrastructures hautement disponibles. Il ne s'agissait pas simplement d'une stratégie commerciale : en effet, les organismes de réglementation des différents secteurs exigeaient que les entreprises de services critiques prennent en compte des mesures d'urgence appropriées dans leur environnement informatique. Les solutions pour relancer les systèmes devaient être clairement rédigées, distribuées dans l’entreprise et surtout appliquées à la lettre, compte-tenu des pertes financières potentielles encourues suite à une interruption d’activité, même de quelques minutes.

Même avec ce système de protection, en cas d’incident, les entreprises étaient nombreuses à préférer tenter une réparation ponctuelle plutôt que le recours à une solution de reprise après sinistre. Ce type de solution était en effet considéré comme du dernier recours, compte-tenu de la complexité du retour à un fonctionnement normal après la restauration de l’élément ou du service défaillant. Le dilemme du "rester ou partir" a contribué à fortement retarder la reprise des services des entreprises.

Les choses se sont déroulées ainsi jusqu'à ce que le cloud se développe et qu’émerge une économie connectée en permanence, nécessitant un accès et un traitement des données en temps réel.

La reprise après sinistre traditionnelle, et surtout la récupération des données en cas d’urgence, ainsi que les coûts et les retards potentiels qui y sont associés, concernent presque toutes les organisations. Pourtant, dans un monde toujours plus connecté, ces méthodes de récupération sont devenues obsolètes.

Désormais, les organisations peuvent bénéficier de solutions de continuité permanente abordables, qui adoptent une approche synchrone active / active afin que les données restent disponibles en simultané sur deux sites. Cela permet que l’activité se maintienne de façon transparente, même si l’un des sites tombe en panne. Cela permet d’assurer une expérience utilisateur ininterrompue grâce à une gestion multisites partagée qui redirige automatiquement le trafic en cas de défaillance. Les objectifs de temps de reprise (RTO) et objectif de point de reprise (RPO) ne font ainsi plus partie de la liste des préoccupations des DSI.

Ainsi, on peut se demander pourquoi les entreprises devraient financer des systèmes de données entièrement redondants et rarement utilisés, alors qu’elles disposent maintenant de solutions beaucoup plus simples, agiles et efficaces, comme la continuité permanente pour obtenir le même résultat.