Fusionner les approches de sauvegarde et de PRA pour restaurer plus vite

Les plans de reprise d'activité (PRA) et procédures de protection des données des systèmes informatiques font appel à deux mondes différents : la protection des données et la sauvegarde sur bandes. Comment les fusionner ?

Depuis des années, plans de reprise d'activité (PRA) et procédures de protection des données des systèmes informatiques font appel à deux mondes différents : la protection des données et la sauvegarde sur bandes. Les processus d'implémentation des deux approches étaient souvent séparés et même gérés par des départements informatiques différents. Les entreprises ont bien essayé de les fusionner, mais en se heurtant toujours à des logiciels et des processus bien spécifiques, tant pour la réplication que pour la sauvegarde.
 
La protection des données a toujours visé le court terme, généralement pour protéger les données durant les horaires de travail des entreprises. La sauvegarde sur bandes a, quant à elle, toujours eu pour vocation de conserver des données sur le long terme. En règle générale, les données protégées au sein des baies de disques sont transférées vers la sauvegarde sur bandes lorsque la nécessité d'en disposer immédiatement n'est plus d'actualité.
 
Le concept de protection continue des données (CDP - Continuous Data Protection) a récemment émergé, comme une solution capable de mieux protéger et de restaurer plus efficacement les données. Dans tous les cas, une solution CDP se doit de proposer une unification des processus locaux et distants de protection de celles-ci. Elle doit par ailleurs combiner réplication et sauvegarde au sein même des fonctionnalités ; garantir une quasi-absence de perte de données, une restauration rapide des données et des environnements en cas de défaillance du système et une totale indépendance vis-à-vis de la restauration bandes.
 
Défis de la sauvegarde sur bandes

La sauvegarde sur bandes constitue une méthode de protection des données à la fois fiable, durable et économique, avec une conservation long terme dans un environnement climatiquement contrôlé. La plupart des sauvegardes sur bandes utilisent des agents placés sur des serveurs où sont hébergées les applications. Ceci permet de sauvegarder les données directement à partir de ces serveurs.
Les agents de sauvegarde consomment de ce fait des ressources de calculs applicatives, ce qui peut devenir un problème lorsqu'on fait appel à la virtualisation des serveurs. Dans certains cas, le serveur de sauvegarde peut lui-même avoir un impact sur le serveur applicatif et causer des dégradations sensibles sur les performances.
 
La croissance exponentielle des volumes de données numériques a également très largement modifié les besoins des serveurs de sauvegarde, à un point tel que la réalisation des sauvegardes dans les fenêtres imparties devient parfois très difficile. De plus, les services en ligne tels que le e-commerce ou les opérations de support clients ont conduit à un net rétrécissement des fenêtres et donc à une complication supplémentaire au niveau de la sauvegarde bandes et de la gestion des supports médias.
 
L'intégrité des données sauvegardées sur bandes s'est souvent avérée assez délicate à garantir, même lorsque les conditions de délai et de validation sont respectées. Raison pour laquelle la fiabilité de la reprise d'activité à partir de bandes est, dans le meilleur des cas, sujette à caution...
 
Les défis des PRA
 
La reprise d'activité à partir de bandes est à la fois imprécise et très consommatrice de temps. Le critère de RPO (Recovery Point Objective), c'est-à-dire le délai qui sépare deux sauvegardes consécutives et donc les données potentiellement perdues, est en général de 24 heures, voire davantage et ceci même avec 100% des données validées. Le critère de RTO (Recovery Time Objective), qui précise le délai nécessaire à la restauration d'une application 100% opérationnelle à partir d'une sauvegarde bandes, dépend principalement de la rapidité à laquelle les données applicatives retrouvent leur cohérence.

De nombreuses sauvegardes sur bandes ne sont jamais validées par manque de temps. Ainsi, bon nombre d'entreprises sont amenées à restaurer "brutalement" des sauvegardes complètes à partir de données non validées.
 
Si les bandes sont stockées dans un site protégé distant, la restauration peut prendre entre quelques heures et quelques jours. Dans ce cas, les bandes doivent être rapatriées avant de procéder aux opérations de restauration. Les pertes de productivité et de revenus dues aux délais trop longs, peuvent être extrêmement préjudiciables à l'entreprise.
 
C'est pourquoi, de nombreuses entreprises sont maintenant convaincues que la sauvegarde quotidienne n'offre pas assez de garanties et que tout RTO de 24 heures doit impérativement être réduit. Elles sont pourtant nombreuses à vivre avec ce risque permanent, en raison des coûts qu'impliquent des solutions plus "agressives" de PRA reposant sur la réplication.
   
Les limites des "snapshot" sur disques
 
D'autres entreprises réduisent leurs délais de reprise d'activité en s'appuyant sur la réplication d'instantanés (snapshots) de volumes disques sur d'autres baies de disques. Cette approche permet de réduire le RPO en enregistrant des modifications de données plus fréquentes que ne le fait la sauvegarde classique.
 
La limite de cette approche réside toutefois dans le fait que la grande majorité des fournisseurs proposent un maximum de 8 ou 16 snapshots par volume, ce qui signifie que lorsque le 9ème ou le 17ème snapshot intervient, le premier est "écrasé". Dans le meilleur des cas, les snapshots provenant de baies de disques offrent un RPO de 1 heure et demie à 3 heures sur une période d'une journée. Ils sont fréquemment connectés sur des volumes applicatifs de serveurs de production, ce qui peut, là encore, diminuer sensiblement les performances.
                                                                                                                   
Cette approche ne comprend pas non plus de mode de journalisation continu, ce qui signifie que les RPO via snapshots se limitent au dernier bon snapshot, lequel peut dater de plusieurs heures...
 
La CDP : un complément à la sauvegarde sur bandes
 
Une solution CDP idéale doit étendre la protection des données basée sur disques sur une plus longue période de temps. Ainsi, elle se doit d'améliorer sensiblement un plan de reprise d'activité s'appuyant sur des snapshots tout en réduisant la dépendance vis-à-vis des sauvegardes bandes quotidiennes. Il n'est pas question de remplacer l'approche bandes. Au contraire, la CDP a pour vocation de renforcer l'efficacité des bandes en termes de PRA et de protection des données. Grâce à la CDP, les règles de PRA deviennent moins dépendantes des restaurations sur bandes, ce qui aboutit à une vitesse et une efficacité bien supérieures des restaurations.
 
Il est important de garder à l'esprit une recherche d'indépendance vis-à-vis de la sauvegarde bandes, car les sinistres ne sont que très rarement la conséquence de catastrophes naturelles. Ces incidents se produisent bel et bien et imposent d'avoir recours à un plan exhaustif de protection et de restauration. Les sinistres les plus fréquents sont plus granulaires : effacement de données fortuit ou volontaire, corruption de données, erreurs d'utilisateurs, virus, ou tout autre événement de cet ordre. L'approche CDP doit compléter la protection de la sauvegarde bandes et offrir des capacités de PRA ne pouvant être possibles via les seules approches PRA avec bandes ou avec snapshot plus réplication. La CDP laisse à la sauvegarde bandes tous ses avantages de rétention et d'archivage long terme, mais réduit (voire supprime) son rôle dans les processus de reprise d'activité, pour lesquels elle n'a pas été vraiment conçue.
   
L'élimination des fenêtres de sauvegarde
 
L'un des défis majeurs auxquels font face les DSI est de réussir à réaliser leurs sauvegardes pendant les périodes creuses, périodes de plus en plus réduites. Les systèmes de e-commerce et les structures de centres de données en mode 24/7 (24 heures sur 24, 7 jours sur 7) ont élevé la sauvegarde bandes au statut de casse-tête permanent. Même la fonctionnalité de mise à jour incrémentale des sauvegardes quotidiennes pose problème au niveau des ressources, compte tenu du rétrécissement des fenêtres autorisées pour les sauvegardes.
 
L'approche CDP résout ce dilemme en proposant une protection des données sur une période de temps plus longue que celle des sauvegardes supportant la fonction snapshot et donc réduit directement la fréquence des sauvegardes bandes. Les entreprises qui implémentent la CDP seront en mesure de réduire leurs besoins en sauvegardes bandes, en passant de la notion de jour à celle de semaine, et même davantage.