Sauvegarde de données et Big Data

Infographie réalisée à partir de l'analyse de 20 To de données sauvegardées.

Que nous apprend le Big Data sur l'usage de la sauvegarde de données ?

Des chiffres instructifs sont issus de cette analyse :
  • 92 % des postes sauvegardés sont sous Windows,
  • Près de 60 % des fichiers sont des fichiers bureautiques (excel, word, PDF...),
  • 42 % des fichiers sont des PDF,
  • 70 % des fichiers sauvegardés n'ont pas été modifiés depuis plus de 1 an,
  • 88 % des fichiers Excel et 84 % des fichiers Word n'ont pas été modifiés depuis plus de 1 an,
  • 368 Ko : c'est le poids moyen d'un fichier sauvegardé,
  • 9 Go : c'est le volume moyen d'un back-up.

Quelles conclusions peut-on tirer de cette infographie ?

  • Dans bien des cas, l'archivage serait plus approprié que la sauvegarde. Car pourquoi sauvegarder en incrémentiel un fichier qui ne bouge pas pendant des mois et peut être considéré comme un fichier "mort" ?
  • Le poids des PDF est extrêmement important et pourrait être réduit en sauvegardant les fichiers source uniquement et les PDF ayant une valeur juridique (contrats signés, devis,...)
  • Nous produisons beaucoup de fichiers bureautiques qui deviennent rapidement obsolètes et qui pourraient faire l'objet d'un "toilettage" plus régulier
  • La sauvegarde en ligne incrémentale est un outil puissant et complexe, permettant de sauvegarder plusieurs versions d'un même fichier sans augmenter l'espace de stockage nécessaire. Mais est-elle toujours utilisée à bon escient ? Une révision des critères de sauvegarde devrait être réalisée à intervalle régulier afin de ne pas engorger le cloud de fichiers qui ne seront jamais restaurés.