Comment la déduplication permet-elle de rationaliser les opérations et de réduire les coûts ?
Quasiment toutes les entreprises doivent stocker et sauvegarder des données, mais rechignent à stocker à grande échelle pour une question de coût, des techniques de stockage hiérarchisé.
Réservée au départ à un ensemble fixe d'applications, la
déduplication gagne en maturité dans les entreprises, qui y voient une
technologie de plus en plus intéressante pour gérer leurs gros volumes de
données. La déduplication des données est une pratique qui convainc de plus en
plus parce qu'elle réduit les données redondantes (les doublons) ainsi que la
consommation de bande passante, de même que les coûts et les efforts de
maintenance pour disposer sur site et dans le Cloud des processus de stockage et
de sauvegarde nécessaires.
Alors que les données deviennent critiques pour le fonctionnement de plus en
plus d'entreprises, un nombre croissant d'applications génèrent et exploitent
des volumes de données de plus en plus importants, ce qui impose d'imaginer des
méthodes toujours plus intelligentes de rationalisation de la bande passante et
des coûts. Parmi celles-ci, on retrouve des processus fondamentaux, d'archivage
notamment, de gestion documentaire et de sauvegarde. Le principe même de
déduplication doit permettre aux entreprises de réduire leurs coûts de stockage
sans augmenter leur exposition aux risques.
Aujourd'hui, la déduplication fonctionne en toute transparence avec les modèles
de stockage Cloud, sur site et hybrides, au sein de la plupart des stratégies
actuelles de stockage hiérarchisé. Ses applications sont locales, par niveau de
stockage, par application, ou globales. Ce sont les besoins et contraintes
spécifiques de chaque entreprise qui guident le choix des types de
déduplication de données et les conditions de leur mise en oeuvre. Il faut en
effet choisir :
· la méthode d'implémentation : matérielle ou logicielle ;
· le niveau d'exécution : infrastructure ou applicatif ;
· la portée : ponctuelle ou historique ;
· la granularité : volume de données, fichier, bloc.
Ces quatre aspects doivent tous être étudiés avant de pouvoir mettre en œuvre
l'instance de déduplication la plus optimale possible, en réponse aux besoins
exacts de l'entreprise. Par exemple, si vos données sont surtout générées à
distance et que vous êtes limité en bande passante, alors les applications
logicielles seront plus avantageuses que les méthodes matérielles.
Si la
définition du doublon se fonde surtout au niveau applicatif (autrement dit, si
un document Word est « identique » à un autre ou la troisième version
de ce document), alors les méthodes au niveau applicatif vous conviendront
probablement davantage. La plupart des entreprises doivent recourir à plusieurs
méthodes de déduplication en fonction de leurs besoins spécifiques.
Les schémas de niveau infrastructure conviennent toutefois à quasiment toutes
les entreprises cherchant à éliminer des redondances de données superflues. Ce
niveau de déduplication permet de réduire les besoins de capacité de stockage
globale et les coûts de stockage car seule une « copie » des données
doit être stockée dans la solution de stockage la plus coûteuse.
Les entreprises doivent aussi s'interroger sur l'intérêt pour elles d'une
stratégie de déduplication primaire ou globale. La déduplication primaire peut
intervenir au niveau de l'application, ou de la source de création des données.
Bon nombre d'applications intègrent d'ailleurs cette technologie de base, comme
avec la fonction « Enregistrer » de Word pour la nouvelle version
d'un document et « Enregistrer sous » pour conserver un document
modifié. La déduplication globale ne peut intervenir qu'au niveau de
l'infrastructure, puisqu'il faut pouvoir accéder à tous les blocs de données
pour identifier les doublons. Sachant cela, les entreprises peuvent limiter une
partie de leurs données redondantes, même si toutes continueront à stocker
plusieurs copies de leurs données. La question étant : stockent-elles
les quelques rares copies dont elles ont besoin et le font-elles de manière
économique ?