Comment la déduplication permet-elle de rationaliser les opérations et de réduire les coûts ?

Quasiment toutes les entreprises doivent stocker et sauvegarder des données, mais rechignent à stocker à grande échelle pour une question de coût, des techniques de stockage hiérarchisé.

Réservée au départ à un ensemble fixe d'applications, la déduplication gagne en maturité dans les entreprises, qui y voient une technologie de plus en plus intéressante pour gérer leurs gros volumes de données. La déduplication des données est une pratique qui convainc de plus en plus parce qu'elle réduit les données redondantes (les doublons) ainsi que la consommation de bande passante, de même que les coûts et les efforts de maintenance pour disposer sur site et dans le Cloud des processus de stockage et de sauvegarde nécessaires.
 
Alors que les données deviennent critiques pour le fonctionnement de plus en plus d'entreprises, un nombre croissant d'applications génèrent et exploitent des volumes de données de plus en plus importants, ce qui impose d'imaginer des méthodes toujours plus intelligentes de rationalisation de la bande passante et des coûts. Parmi celles-ci, on retrouve des processus fondamentaux, d'archivage notamment, de gestion documentaire et de sauvegarde. Le principe même de déduplication doit permettre aux entreprises de réduire leurs coûts de stockage sans augmenter leur exposition aux risques.
 
Aujourd'hui, la déduplication fonctionne en toute transparence avec les modèles de stockage Cloud, sur site et hybrides, au sein de la plupart des stratégies actuelles de stockage hiérarchisé. Ses applications sont locales, par niveau de stockage, par application, ou globales. Ce sont les besoins et contraintes spécifiques de chaque entreprise qui guident le choix des types de déduplication de données et les conditions de leur mise en oeuvre. Il faut en effet choisir :
 

·  la méthode d'implémentation : matérielle ou logicielle ;

·  le niveau d'exécution : infrastructure ou applicatif ;

·  la portée : ponctuelle ou historique ;

·  la granularité : volume de données, fichier, bloc.


Ces quatre aspects doivent tous être étudiés avant de pouvoir mettre en œuvre l'instance de déduplication la plus optimale possible, en réponse aux besoins exacts de l'entreprise. Par exemple, si vos données sont surtout générées à distance et que vous êtes limité en bande passante, alors les applications logicielles seront plus avantageuses que les méthodes matérielles.

Si la définition du doublon se fonde surtout au niveau applicatif (autrement dit, si un document Word est « identique » à un autre ou la troisième version de ce document), alors les méthodes au niveau applicatif vous conviendront probablement davantage. La plupart des entreprises doivent recourir à plusieurs méthodes de déduplication en fonction de leurs besoins spécifiques.
 
Les schémas de niveau infrastructure conviennent toutefois à quasiment toutes les entreprises cherchant à éliminer des redondances de données superflues. Ce niveau de déduplication permet de réduire les besoins de capacité de stockage globale et les coûts de stockage car seule une « copie » des données doit être stockée dans la solution de stockage la plus coûteuse.
 
Les entreprises doivent aussi s'interroger sur l'intérêt pour elles d'une stratégie de déduplication primaire ou globale. La déduplication primaire peut intervenir au niveau de l'application, ou de la source de création des données. Bon nombre d'applications intègrent d'ailleurs cette technologie de base, comme avec la fonction « Enregistrer » de Word pour la nouvelle version d'un document et « Enregistrer sous » pour conserver un document modifié. La déduplication globale ne peut intervenir qu'au niveau de l'infrastructure, puisqu'il faut pouvoir accéder à tous les blocs de données pour identifier les doublons. Sachant cela, les entreprises peuvent limiter une partie de leurs données redondantes, même si toutes continueront à stocker plusieurs copies de leurs données. La question étant : stockent-elles les quelques rares copies dont elles ont besoin et le font-elles de manière économique ?