PME : comprendre le DRaaS et son caractère essentiel pour limiter les temps d'interruptions

Parmi les sociétés les plus vulnérables aux cyberattaques figurent les PME. Près de la moitié d'entre elles estiment qu'une heure d'interruption de leur activité équivaut à une perte de 100 000 dollars liés aux revenus, à la productivité des utilisateurs finaux et au support informatique.

Aujourd'hui, les entreprises de toute taille peuvent faire face à des cyberattaques impactant la continuité de leurs activités. Et parmi les plus vulnérables figurent les petites et moyennes entreprises (PME) comme le démontre cette étude de l'ITIC qui révèle que près de la moitié de celles-ci estiment qu'une seule heure d'interruption de leur activité équivaut à une perte de 100 000 dollars liés aux revenus, à la productivité des utilisateurs finaux et au support informatique.

Dans ce contexte, de plus en plus de PME adoptent des stratégies de reprise après sinistre en mode DRaaS (Disaster Recovery as a Service), que 34% des entreprises ont prévu d’implémenter en 2021, selon la même enquête citée précédemment.

Les solutions de sauvegarde et de reprise après sinistre basées dans le cloud sont souvent privilégiées lorsque l’on envisage une telle approche. Elles permettent en effet d'accéder aux données n'importe où, n'importe quand et avec une certaine fiabilité puisque ces systèmes hautement distribués et résilients face aux incidents garantissent une disponibilité à 99,999+%.

Voici donc comment aider les PME à comprendre les principaux composants et exigences d'une solution DRaaS.

La réplication : les sauvegardes distribuées optimisent la protection des données

Il s’agit là du processus qui consiste à mettre à jour des copies de données à plusieurs endroits en même temps. Son objectif : s'assurer que les données soient disponibles pour les utilisateurs lorsqu'ils en ont besoin.

La réplication des données synchronise les bases sources - par exemple le stockage primaire - avec celles cibles de sauvegarde. Ainsi, lorsque des modifications sont apportées aux bases sources, elles sont rapidement mises à jour dans les sauvegardes. La base cible peut contenir l’ensemble des données de son homologue, on appelle alors cela une réplication complète, ou seulement un sous-ensemble de ces informations.

Dans un but de sauvegarde et de reprise après un sinistre, il semble logique d'effectuer des réplications complètes. Mais les entreprises peuvent également réduire la charge de leur base source pour les fonctions d'analyse et de reporting en répliquant seulement des sous-ensembles, par exemple par département ou par pays.

Gestion et maintenance des images de sauvegarde

Au fur et à mesure que les entreprises continuent d'ajouter des sauvegardes, elles doivent s’assurer de pouvoir gérer ces images accumulées ainsi que l'espace de stockage qu'elles consomment. Les solutions de gestion d'images avec une structure en dossiers leur permettent d’économiser le temps passé à configurer les sauvegardes, mais aussi de fournir une vérification d'image afin que les fichiers soient prêts et disponibles pour une récupération rapide et fiable. Elles peuvent enfin effectuer une autre forme de vérification avancée qui propose une confirmation visuelle régulière du bon fonctionnement des sauvegardes.

Pour réduire le temps de récupération, le risque de corruption des fichiers et l'espace de stockage nécessaire, il est recommandé d’adopter de telles solutions pour consolider les données de manière automatique. Ainsi, les entreprises pourront relever ces défis en définissant des politiques adaptées à leurs besoins et surveiller les tâches de sauvegarde dans l'interface utilisateur avec des alertes envoyées en cas de problème.

En résumé, les solutions de gestion d'images permettent de gérer les ressources du système pour permettre leur traitement simultané. Les sauvegardes sont alors répliquées sur des bases cibles - locales, sur le réseau et/ou dans le cloud - de sorte que les entreprises soient toujours prêtes à faire face aux attaques. Enfin, la solution permet aussi de planifier la restauration d’un serveur avant qu'un sinistre ne survienne pour, in fine, réduire les temps d'arrêt.

Le basculement : un moteur essentiel à la continuité des activités

Ce mode opérationnel de sauvegarde permet de faire basculer un serveur vers une base de données si le système principal tombe en panne ou est hors ligne pour maintenance. Il assure ainsi la continuité des activités en redirigeant de manière transparente les demandes du système défaillant ou hors service vers celui de secours. Ce dernier doit être capable d’imiter l'environnement du système d'exploitation principal et se trouver sur un autre appareil ou dans le cloud.

Avec des capacités de basculement pour les serveurs, les bases de données et les réseaux, vous pouvez compter sur une disponibilité continue et une fiabilité optimale. Supposons que le serveur principal sur site tombe en panne. La procédure de basculement prend alors en charge les besoins d'hébergement en un seul clic. Elle permet également aux entreprises d'exécuter des projets de maintenance, sans surveillance humaine, pendant les mises à jour programmées. Enfin, cela garantit une protection maximale contre les risques de cybersécurité.

Si l'intégration du basculement peut sembler coûteuse, il est essentiel de comparer ce frein au coût incroyablement élevé des temps d'arrêt. Il convient alors de considérer le basculement comme une police d'assurance de sécurité critique et un élément essentiel de tout plan de reprise après sinistre. Du point de vue de l'ingénierie, l'accent doit être mis sur la minimisation des transferts de données. Cet élément permettra ainsi de réduire les goulets d'étranglement tout en assurant une synchronisation de haute qualité entre les systèmes principaux et de secours.

La reprise après sinistre : un retour à la normale fluide

C’est ici la suite du basculement. Alors que celui-ci consiste à passer à une source de secours, le retour à la normale ou failback est le processus de récupération des données sur la ressource originale à partir d'une sauvegarde. Une fois que la cause du basculement est éliminée, l'entreprise peut reprendre ses activités de manière normale. Cela implique également l'identification de tous les changements effectués pendant que le système de reprise après sinistre fonctionnait à la place du primaire.

Il est essentiel que la solution de reprise après sinistre puisse exécuter les charges de travail de l'entreprise et maintenir la continuité des opérations aussi longtemps que nécessaire. C'est pourquoi les tests de ces plans sont essentiels. En effet, les suivre de près et documenter toute lacune dans leur mise en œuvre afin de la combler est fondamentale. Des tests réguliers permettront de gagner un temps précieux lorsque l'entreprise sera confrontée à un tel incident.

La prise en compte de plusieurs aspects sur la notion de failback est également importante. Et la connectivité est la première sur la liste. S'il n'y a pas de connexion ou de voie d'accès fiable entre les données primaires et celles de sauvegarde, l’application de la procédure ne sera probablement pas possible. Une connexion sécurisée garantit qu'un failback puisse être effectué sans interruption. Les entreprises doivent donc être sûres que leurs données sources et cibles de sauvegarde soient toujours synchronisées, de sorte que le risque de perte d’éléments soit réduit au minimum.

Elles doivent également s'assurer que les données stockées sur leur site de reprise après sinistre soient sécurisées. Et si un incident survient, qu’il est possible de se rétablir rapidement. Supposons qu'un basculement se produise et que les opérations de l'entreprise soient désormais exécutées à partir d'un cloud de reprise après sinistre. Dans ce cas, elle doit protéger les données de cet environnement virtuel en les répliquant immédiatement sur ses cibles de sauvegarde. C'est pourquoi la bande passante du réseau est la prochaine préoccupation. Si celle-ci est insuffisante, des goulets d'étranglement et des retards perturberont la synchronisation et entraveront la reprise.  

Le test est l'élément le plus critique pour garantir la réussite du plan de reprise après sinistre lorsque les entreprises en ont besoin. Cela signifie qu'il faut tester tous les systèmes et réseaux pour s'assurer qu'ils sont capables de reprendre leurs activités dans un tel contexte. Il est alors conseillé d’avoir recours à un autre site comme environnement de test et d'utiliser les connaissances acquises grâce à celui-ci pour optimiser les plans en plan.

Qu'il s'agisse d'une catastrophe naturelle telle qu'une ou une inondation, d'une panne de courant locale ou même d'un ransomware, l'intérêt commercial d’une stratégie DRaaS ne peut être remis en question. Elle garantit la continuité des activités, quoi qu'il arrive, et permet la récupération à l'échelle du site de manière rapide et facile à partir d'un cloud.

Le coût d’un tel sinistre, impactant la perte de données, mais aussi de productivité et la réputation, peut équivaloir à un an, voire plusieurs années d’équipement avec une telle stratégie.