Le stockage de données informatiques : une donnée stratégique pour les entreprises

L'informatique occupe une place de plus en plus importante et produit une masse de données en croissance constante. Le choix du support de stockage de ces données doit se faire en fonction de différents paramètres, comme le volume, la fréquence d'utilisation ou encore la durée minimale de disponibilité.

En informatique, toutes les informations sont codées en binaire, c'est à dire sur 2 états que l'on représente par 0 et 1. Un 1 ou un 0 est appelé bit, tandis qu'un groupe de 8 bits est appelé octet (ou byte en anglais). Un octet peut donc prendre 2^8 soit 256 valeurs. Un Ko (kilo octet) est défini comme une groupe de 2^10=1024 octets, le Mo (mega otctet) vaut 1024Ko, le Go (giga octet) vaut 1024Mo, le To (tera octet) vaut 1024Go, le Po (peta octet) vaut 1024To, etc.

Les supports

Afin de stocker ces successions de 1 et de 0, différents supports existent, que l'on peut regrouper en 4 grandes familles :

> Supports physiques
Abandonné depuis le début des années 80, ce type de support à été le premier type de mémoire de masse utilisé en informatique. Les données étaient enregistrées sur des bandes ou cartes perforées, un trou représentant un 1 et pas de trou un 0.

> Supports magnétiques
Sans doute le type de support de stockage de masse le plus utilisé aujourd'hui, les 1 et 0 sont stockés sous forme de champ magnétique. Parmi cette famille de supports on retrouve la cassette (comme les cassettes audio) qui ont été utilisées quelques temps dans les années 80, les disquettes qui ont remplacées les cassettes (jusqu'au début des années 2000), la bande magnétique qui est toujours utilisée comme support d'archivage ou le disque dur présent dans la plupart des ordinateurs actuels.

> Supports optiques
Ce type de support stocke les informations sous forme de reliefs détectés par un rayon laser (un creux=0, une bosse=1). Les CD, les DVD et maintenant les Blue-Ray font partie de cette famille, la différence entre ces 3 technologies se faisant au niveau de la couleur du rayon laser utilisée, directement liée à la taille du faisceau impactant la densité d'informations. Un CD utilise un laser rouge (le plus large), un DVD un laser orange et enfin un Blue-Ray un laser bleu (le plus fin).

> Supports à mémoire flash
Derniers nés des types de supports de stockage, ils utilisent des semi-conducteurs (notamment des transistors MOS) pour stocker les 1 et les 0. Si le transistor bloque le courant, un 1 est enregistré, si au contraire il le laisse passer, c'est un 0 qui est stocké. Ce type de mémoire se retrouve notamment dans la RAM des ordinateurs, les clefs USB, les cartes mémoires (CF, SD, MMC, MS...) et plus récemment dans les SSD (disques durs à mémoire flash).

Protéger ses données

La protection de ses données informatiques se positionne comme une donnée stratégique. Après quelques définitions, nous allons aborder les différents risques que courent vos données, et les moyens d'y pallier.

Le RAID est une méthode d'agrégation de plusieurs volumes physiques pour ne former qu'un seul volume logique. Il existe plusieurs niveaux de RAID permettant d'améliorer les performances et/ou la sécurité de disques pris séparément. Pour mettre en place du RAID sur un ordinateur, on a le choix entre le RAID matériel et le RAID logiciel. Dans le premier cas, on utilise une carte contrôleur dédiée à laquelle sont rattachés les disques, et c'est la carte qui va s'occuper de la répartition des données sur les disques ainsi que des calculs de parité. Dans le deuxième cas, les disques sont directement rattachés à la carte mère, et c'est le processeur principal qui va réaliser les opérations de répartition des données et les calculs de parité.

Les sauvegardes consistent à faire des copies régulières des fichiers à un instant t (sur le même support ou un support différent), destinées à remplacer les fichiers originaux en cas de perte ou de corruption des données. Ces copies peuvent se faire manuellement ou automatiquement, la dernière solution évitant les oublis... La "durée de vie" d'une sauvegarde est relativement faible, dans la mesure où elle ne devrait plus être utile dès que la nouvelle sauvegarde est terminée. Cependant, si la dernière sauvegarde a été effectuée à partir d'un fichier non valide, avoir plusieurs versions des sauvegardes peut s'avérer intéressant!

L'archivage permet de libérer de l'espace sur des médias à accès "rapide" (disque dur, SSD...) en transférant les fichiers qui ne sont plus utilisés régulièrement mais néanmoins utiles sur des supports de grande capacité, fiables et peux couteux (typiquement des bandes magnétiques). Contrairement aux sauvegardes, la durée de vie d'une archive est de l'ordre de quelques années à quelques dizaines d'années.

Les risques et leurs parades

Le premier risque auquel on peut penser est la défaillance matérielle. Les disques durs font parties des pièces les plus fragiles constituant un ordinateur, mais d'autres éléments peuvent tomber en panne comme l'alimentation, le processeur ou la RAM...
Dans un premier temps on peut essayer d'éviter ces pannes, par exemple en ondulant l'alimentation de la machine, les variations de potentiel pouvant endommager la plupart des composants... Ensuite, la meilleure parade dans ces cas est d'avoir redondé les composants sensibles : utiliser du RAID (1 ou 5) pour les disques durs, une double alimentation, voire un double processeur...

Dans le cas où des données on été perdues, soit à cause d'une erreur humaine soit à cause d'un problème matériel (ex: coupure d'électricité lors d'écritures sur le disque), le moyen le plus sur de récupérer (une partie) des données est de repartir de la dernière sauvegarde effectuée, en espérant qu'elle ne soit pas trop ancienne. Il existe aussi des outils permettant de restaurer des fichiers supprimés sur différents systèmes de fichiers, mais à utiliser vraiment en dernier recours, les fichiers à restaurer n'étant pas forcément faciles à retrouver, et les données récupérées pouvant n'être que des fragments de fichiers finalement inexploitables...

Finalement en cas de sinistre dans des locaux, si les équipements informatiques ne sont plus exploitables, ce sont les sauvegardes externalisées qui vont permettre une reprise d'activité une fois le matériel restauré/remplacé. Les sauvegardes externalisées, sont des sauvegardes qui ne sont pas stockées sur le même site géographique.

Conclusion

Il existe de nombreux supports de stockage aux caractéristiques différentes. Le choix du bon support doit donc se faire en fonction de différents paramètres comme la capacité, le cout, les besoins de performance ou non...

Le disque dur magnétique reste cependant la valeur sûre du stockage de masse pour une utilisation quotidienne, de par son rapport (capacité + performance)/prix mais également de par sa souplesse d'utilisation (écriture, réécriture, effacement...). Les disques SSD bien qu'encore peu répandus, sans doute à cause de leur prix bien plus élevé, pourraient cependant venir remplacer prochainement les disques durs de nos ordinateurs personnels.

Les médias optiques bien que moins simples d'utilisation que les disques durs par exemple (utilisation d'un logiciel de gravure), bénéficient encore d'une image de fiabilité à plus ou moins juste titre et devraient encore avoir de beaux jours devant eux. Leur prix relativement faible (supports vierges et graveur) en fait une solution de choix pour l'archivage à petit budget.

En ce qui concerne la protection des données, nous avons vu qu'il existait différents risques dont les méthodes de prévention ne sont pas les même, l'idéal étant de pouvoir cumuler les différentes mesures préventives afin de pallier un maximum de problèmes éventuels.

Lorsqu'il y a plusieurs postes à protéger, mettre en place des mesures préventives sur chacune des machines peut rapidement devenir couteux aussi bien en temps qu'en argent...

L'idéal dans ce type de configuration est encore de laisser travailler les personnes sur un serveur de fichier dont les disques sont montés en RAID et les composants éventuellement redondés, et d'effectuer les sauvegardes et les archivages sur le serveur ou les données sont centralisées.

Cependant une telle politique n'est pas toujours possible, notamment avec les utilisateurs nomades ou les télétravailleurs. Dans ce cas, il existe des logiciels/solutions de sauvegarde permettant de centraliser les sauvegardes et d'éventuellement les externaliser automatiquement vers un serveur de stockage sur internet (les fournisseurs d'accès internet proposent généralement des espaces de stockage pour leurs abonnés). Pour l'archivage, l'utilisation de bandes magnétiques peut être avantageuse, le prix élevé d'un lecteur de bandes étant amorti par le faible coût des supports