Enjeux et approches pour une gestion de données à distance réussie

L’évolution des risques liés à la sauvegarde des données à distance conduit les entreprises à réévaluer leurs processus de gestion des données, alors qu’elles doivent déjà faire face à de nombreux défis.

Quels sont ces défis ? La multiplication des types de réseaux et de plates-formes, le manque de personnel spécialisé au niveau des sites distants, le coût des méthodes traditionnelles de gestion de données à distance, etc. Il est cependant possible de répondre de façon rentable à ces problématiques grâce à des technologies avancées de gestion des données à distance.


Comprendre les enjeux des données distantes

La protection des données distantes et la gestion des échanges de données entre l'entreprise et ses sites distants n'est pas simple et coûte souvent cher. Les DSI passent beaucoup de temps à gérer des problèmes liés à la sauvegarde et au transfert des données d'un site à l'autre.

Pourtant, au niveau des sites distants, des processus aussi critiques que la sauvegarde ne sont pas toujours gérés de façon adéquate et le personnel IT doit souvent compter sur le personnel non spécialisé pour réaliser des actions pour lesquelles ils n'ont pas les compétences requises.

Alors que les procédures nocturnes de sauvegarde à distance ne sont pas toujours fiables (estimation du risque d'échec à 60 %), les entreprises ne peuvent se permettre une telle prise de risque.

En effet, dans le cas d'une défaillance, la récupération des données est un travail long et fastidieux qui n'est réalisable que sous réserve que les données aient été sauvegardées de façon adéquate. D'autres méthodes, comme la consolidation, la sauvegarde sur disque et l'archivage centralisé, accroissent la fiabilité et la protection des données.

Considérations sur la gestion des données à distance

Gestion centralisée à base de règles

Pour contrôler efficacement les données sur les sites distants, les entreprises doivent centraliser leurs politiques et les appliquer sur tous les sites distants. Si de nombreux produits sensés assurer un « contrôle centralisé » n'établissent en fait qu'une connexion centralisée pour chaque noeud distant, il existe des technologies « set it and forget it » qui automatisent la politique de l'entreprise au noeud distant et émettent des notifications au cas où quelque chose ne se passe pas conformément à la politique convenue.

Utilisation en réseau WAN à large bande passante

Les restrictions de bande passante ainsi qu'un certain nombre de conditions réseau doivent être prises en compte. Les sites distants ont souvent une disponibilité de bande passante qui varie et doit être partagée entre diverses applications et utilisateurs.

Les solutions de gestion des données à distance doivent donc être accompagnées de fonctionnalités d'optimisation de la bande passante disponible (byte-level differential data transfer, contrôle d'étranglement de bande passante, multi streaming et compression). La quantité de surdébit générée sur le réseau est également à prendre en considération.


Intégrité et la sécurité des données

Il s'agit d'un problème majeur. Les réseaux étant sensibles aux intrusions, particulièrement sur des sites distants où les contrôles sont plus rares, il faut authentifier tous les noeuds d'envoi et de réception avant tout transfert de données et crypter les données pendant la transmission. Lorsque la sauvegarde distante se fait sur bande, l'une des principales causes d'échec de reprise d'activité est la corruption des données sur la bande. Avec certaines technologies de sauvegarde disque à disque, l'intégrité des données peut être garantie à 100%.


Automatisation des processus distants et l'interfaçage des applications

Afin de minimiser ou d'éliminer le besoin de main d'oeuvre sur les sites distants, il faut automatiser les processus et interfacer les applications distantes pour accéder aux données. Par exemple, lors de la sauvegarde d'applications Exchange ou SQL Server, il est préférable de faire appel à des programmes de sauvegarde natifs.

Pour des applications comme SAP, on accède aux données via l'application pour en assurer l'intégrité, et non directement par la base de données, le système de fichiers ou les disques.

Support de systèmes hétérogènes

Il est courant qu'une entreprise dotée de plusieurs sites distants ait diverses plates formes et applications. Il est donc important de choisir une solution compatible avec un environnement hétérogène.


Copie instantanée ou réplication continue ?

La réplication continue permet de surveiller le système de fichiers et de faire une capture de toute modification à tout moment soit pour une réplication immédiate, soit pour un transfert ultérieur en bloc via la mémoire cache. Idéale pour la gestion de la continuité des affaires, la réplication continue l'est moins en ce qui concerne les processus périodiques comme la sauvegarde ou l'archivage. La réplication immédiate est à ce titre plus appropriée et plus efficace.

La sauvegarde à distance est ainsi soumise à certaines conditions, notamment pour la sauvegarde disque à disque et la consolidation, où l'intégrité des données, l'automatisation des opérations, le stockage externe et bien entendu la restauration sont de mise, bien au-delà de la simple écriture sur bande.

Lors du stockage, il s'agit particulièrement de préserver l'intégrité des données, le principe de la sauvegarde étant de pouvoir restaurer les données intègres.

L'archivage

Souvent négligé, l'archivage est une composante clé de la gestion et de la protection de données à distance. Peu de gens ont le temps de nettoyer leur boîte email, dont le contenu, associé aux fichiers qui s'empilent dans les dossiers privés/partagés, grossit la quantité de données à traiter.

Une récente étude de Storage Magazine met d'ailleurs le doigt sur ce problème, qui est l'une des principales raisons de défaillance du processus de sauvegarde.

Les énormes quantités de données à traiter monopolisent une part importante des ressources de stockage. Pourtant, la plupart des fichiers et des emails sont rarement réutilisés au-delà de trois jours suivant l'envoi/la réception. Des statistiques montrent que si un fichier n'est pas sollicité sous 90 jours, il y a plus de 90 % de chances pour qu'il ne soit jamais sollicité.

Mais le problème est qu'il est impossible de prévoir quelles seront les données qui constitueront les 10 % de données sollicitées à nouveau. Une solution de stockage secondaire à long terme comme l'archivage prend ici tout son sens.

Les règlementations en place relatives à la conservation des données pour une période définie viennent également justifier le recours à l'archivage, qui peut représenter un vrai défi pour une société dont les sites sont soumis à des réglementations différentes. L'approche la plus viable et la plus rentable est l'archivage consolidé qui permet de transférer automatiquement les données inactives des disques distants vers des référentiels d'entreprise.

L'approche de la consolidation

Plutôt que de compter sur des sauvegardes individuelles ainsi que sur des processus et du personnel séparés pour chaque site distant, confier le contrôle de la gestion et la sauvegarde des données à distance à une seule équipe centralisée sera beaucoup plus efficace.

Pour cela, il faut bien comprendre l'évolution des propriétés et caractéristiques des données distantes. Les solutions choisies doivent permettre de configurer la politique à suivre en matière de données, d'automatiser les processus d'exécution de cette politique sur des serveurs distants puis de transférer les données entre les serveurs distants ou « edge » et le système central ou « core ».

Les processus de sauvegarde et d'archivage individuels au niveau des sites distants sont ainsi remplacés par un processus consolidé qui transfère les données distantes à un site concentrateur dédié à la sauvegarde et à l'archivage.

Ceci implique le transfert des données pertinentes sur les réseaux disponibles d'une façon sûre et rapide sur la base de technologies pouvant gérer les problématiques liées à la circulation des données via plusieurs sites et connexions réseau. La centralisation et l'automatisation des processus permettent de réduire les coûts jusqu'à 75 % (infrastructures de stockage, mise en place de personnel qualifié sur chaque site, etc. ne sont plus nécessaires).


La sauvegarde consolidée disque à disque

La sauvegarde disque à disque connaît un vif succès du fait des possibilités offertes en termes de réduction rapide des coûts liés au stockage, du manque relatif de fiabilité des programmes de stockage manuel et de la nécessité de pouvoir accéder aux données pour lancer un processus de restauration.

Il s'agit de transférer les données à sauvegarder vers un site différent via le réseau, et ce afin de pouvoir assurer leur restauration en cas d'incident (inondation, incendie, etc.) tout en optimisant les processus au niveau des opérations, des coûts et de la sécurité des données.

Il existe deux architectures de sauvegarde consolidée : le transfert de données différentielles vers un disque central ou la consolidation d'images disque. Avec le transfert de données différentielles, l'architecture la plus courante, les données sont régulièrement analysées pour déterminer les données différentielles par rapport à la dernière sauvegarde et en envoyer une copie au site central où ces données sont stockées sur disque, soit par paquets, soit par reconstruction.

Dans le cas de la reconstruction, l'ensemble des données est mis à jour, ce qui offre l'avantage de pouvoir accéder instantanément aux fichiers individuels si un fichier distant est effacé par accident. La deuxième architecture consiste quant à elle à faire des sauvegardes sur serveurs distants pour un stockage sur disque local. Une image disque est alors sauvegardée au niveau du site distant.

Cette approche est efficace dans le cas où l'on a des applications natives ou des programmes d'analyse sélective. On peut synchroniser les deux approches, le transfert de données différentielles étant plus adapté à la sauvegarde des données utilisateur, alors que la consolidation par image peut être plus efficace pour la sauvegarde de données Exchange par exemple.