Grâce à la virtualisation, les parois des silos de stockage s’effacent

La virtualisation du stockage permet de gagner en efficacité, en flexibiité, en rapidité et en sécurité. Elle ne se limite pas aux disques durs. Tour d'horizon.

Evoquer la virtualisation du stockage de manière globale serait trop réducteur d'un point de vue pratique. Qu'il s'agisse d'optimiser l'exploitation des disques durs ou de créer un environnement de stockage hétérogène, voire distribué, dans un même ensemble, l'approche est différente pour chaque situation. La mise en place de volumes RAID entre déjà dans le cadre de la virtualisation du stockage. Les disques physiques n'étant pas fiables, ils sont transformés en un ensemble virtuel à tolérance de pannes. Si un disque dur tombe en panne, le logiciel RAID donne l'illusion qu'il est encore présent.

Les LUN elles-mêmes ne sont rien d'autres que des mondes virtuels. Elles se comportent comme un disque dur unique de grande capacité et peuvent être configurées pour chacune des applications communiquant directement avec les disques. Le dimensionnement des unités logiques constitue un art en soi ; il est axé en premier lieu sur les exigences de performance et sur la croissance estimée du volume de données. La capacité des volumes ne peut toutefois évoluer que dans un sens : son augmentation, bien que difficile, reste possible, alors que sa diminution est en principe impossible. Si la croissance effective du volume de données est en deçà des prévisions, le stockage affecté ne peut plus être retiré ou installé différemment, que sa capacité soit utilisée ou non.

L'allocation dynamique : le stockage « juste à temps »

L'allocation dynamique distingue la représentation logique du stockage des baies de disque physiques sous-jacentes, de sorte que la capacité de stockage allouée aux applications est supérieure à la capacité réellement installée. Dans la mesure où l'ensemble des disques est mis à disposition de la totalité des ensembles de données sous la forme d'un pool de stockage, il permet d'avoir recours aux ressources inutilisées en vue d'exploiter les performances et de répartir la charge au mieux, et de procéder à une utilisation ciblée.  L'espace de stockage physique n'est vraiment occupé que lorsque les données sont réellement écrites.

Au niveau système

La virtualisation du stockage ne se limite pas aux disques durs. Des systèmes complets, quel que soit leur emplacement, peuvent être reliés à un pool de stockage logique à l'aide de la méthode appropriée. Un système peut également être scindé en plusieurs systèmes indépendants. Quant à savoir où se situe l'intelligence de virtualisation, les avis divergent. Les éditeurs de logiciels optent pour la variante basée sur l'hôte avec un sous-système de disques sous la forme d'un JBOD (Just a Bunch of Disks).

Les fabricants de matériel de stockage, quant à eux, s'orientent vers la virtualisation au moyen de contrôleurs. Pour permettre la virtualisation du stockage, le système doit généralement présenter des performances de calcul élevées. Si la virtualisation est basée sur l'hôte, cette nouvelle fonction rivalise avec les autres fonctions de l'hôte pour solliciter les ressources de processeur. En fonction de la charge, le niveau de performances peut être plus ou moins affecté, nécessitant des ajustements en termes de processeur ou d'E/S. La virtualisation basée sur des contrôleurs part directement du système de stockage et y est étroitement intégrée. La séparation logique d'un système de stockage en plusieurs est dans ce cas une possibilité intéressante. Un contrôleur de stockage virtuel est une instance, petite mais subtile, du serveur, contenant toutes les données requises et attributs associés tels que les droits, les préférences de sécurité, etc.

Contrairement à une machine virtuelle statique, qui repose sur du matériel partitionné, le contrôleur de stockage virtuel est dynamique. Là non plus, il n'existe pas de référence directe aux disques durs. Pour qui veut faire évoluer les structures existantes, la virtualisation par contrôleur de stockage est un concept aux multiples facettes. Les baies de stockage, systèmes NAS ou SAN existants de différents fabricants peuvent être représentées sous la forme d'une unité logique à l'aide d'un moteur de virtualisation.

Espace de nommage global

L'espace de nommage global est une solution de virtualisation pour les fichiers. Il est aux fichiers ce qu'un DNS est au réseau : un service d'annuaire indépendant de l'emplacement, couvrant plusieurs systèmes de fichiers distribués et hétérogènes. L'accès aux fichiers s'effectue de manière similaire à l'accès au Web : après la saisie de l'URL, le navigateur prend en charge l'accès au serveur approprié et la conversion du texte et des images à l'écran (certainement le type de virtualisation le plus connu et le plus répandu).

Le chemin d'accès aux données reste invisible à l'utilisateur tout comme le déplacement éventuel de la page Web vers un autre serveur ou espace de stockage. Lorsqu'un espace de nommage global est configuré, l'Explorateur Windows (ou tout autre lecteur réseau) peut par exemple servir de moyen d'accès. L'administrateur peut alors déplacer les fichiers en vue d'optimiser les performances et l'utilisation de la capacité. En cas d'ajout de stockage ou de consolidation du stockage, les fichiers sont déplacés ou renommés. Ainsi, les clients sont automatiquement orientés vers le nouvel emplacement, mais ce déplacement des données n'est toujours pas visible. Cette approche simplifie la gestion des données au sein du réseau car la reconfiguration permanente du Bureau, le mappage des lecteurs et la modification des scripts de connexion deviennent inutiles.

Ces tâches sont en revanche courantes dès qu'un dispositif de stockage est reconfiguré. Dans les environnements Windows ou Unix, un espace de nommage global est défini de manière à permettre, depuis un point d'accès unique, d'accéder à des données stockées sur différentes baies de stockage. Ainsi, il est présenté une vue logique unique des fichiers et des systèmes. Il ne s'agit toutefois que des aspects élémentaires. Les avantages réels résident dans la capacité d'automatisation de la gestion des services de stockage et des données. On compte parmi ceux-ci la gestion unifiée des données réseau, la migration et la consolidation des données, la continuité de l'activité, l'optimisation de la capacité de stockage, la gestion du cycle de vie des données, la gestion des données à distance et multisites ainsi que la classification des données et le reporting.

Autre avantage, plus structurel que fonctionnel, il n'est pas nécessaire de changer un matériel pour avoir plus de puissance et de volumétrie, mais de l'agréger à un autre. On parle alors de « Scale Out ». La virtualisation permet la simplification aux niveaux les plus divers. Suivant le principe « faire plus avec moins », elle sert à gérer un volume de données plus important et plus varié à l'aide de méthodes moins nombreuses et plus simples.

Autour du même sujet