29/10/01
Stockage:
San, Nas, iSCSI, iFCP, FCIP, Infinibanb, etc. : trouvez
vos marques !
(Mis
à jour le 15/01/2002)
Pourquoi
parle-t-on de " stockage en réseau"
?
Lorsque l'on
parle de stockage en réseau, c'est par opposition
à l'attachement direct (de type DAS, Direct
Attached
System) où chaque disque ou ensemble de disques
est physiquement lié à une seule unité
se commande, serveur de fichier ou mainframe, par définition
indépendante. Le stockage en réseau fait
généralement référence à
deux types de solution distinctes: le NAS (Network Attached
Storage) et le SAN (Storage Area Network). Mais l'expression
est ambigue. Dans le cas du NAS, le réseau dont
on parle est le réseau IP (de type Ethernet)
qui permet de mutualiser les données stockées
sur les serveurs de fichiers reliés entre eux
par le LAN (Local Access Network) de l'entreprise. Dans
celui du SAN, il n'est pas question d'infrastructure
IP. Ce que la notion recouvre ici en fait - à
savoir la mise en relation de serveurs avec des baies
de disques qui stockent des données routées
et hiérarchisées via des commutateurs
- est un réseau
physique, le plus souvent constitué par des câbles
en fibre optique (fibre channel).
A quels besoins répondent les architectures
de stockage de type NAS ou SAN ?
L'une
et l'autre tentent de répondre aux besoins croissants
des entreprises en matière de consolidation et
de mutualisation des données à stocker
et à sauvegarder. A mesure que le volume et les
sources des données à conserver se font
plus importantes, il devient en effet matériellement
impossible de n'avoir qu'un point de stockage, comme
dans le cas du DAS. Une différence radicale sépare
cependant les deux technologies : le NAS utilise le
réseau courant de l'entreprise (LAN), alors que
le SAN constitue en lui-même un réseau
dédié au stockage. Les possibilités
offertes par le second sont donc nettement supérieures
à celles du NAS, mais le coût induit est
corollairement plus élevé. Pour simplifier,
on peut dire que le SAN répond aux exigences
des grandes entreprises en termes de disponibilité
de bande passante comme de criticité des applications,
alors que le NAS correspond en général
aux besoins moins contraignants des PME/PMI.
Quels
sont les avantages comparatifs NAS/SAN ?
Qualité
de service (Qos) : c'est l'un des arguments majeurs
du SAN. Le réseau Ethernet se lequel repose le
NAS n'offre en effet aucune garantie quant au fait que
la requête envoyée par un serveur a bien
été reçue et prise en compte par
les système de stockage. Dans le cas du SAN le
commutateur prend en charge cette fonction et garantit
en outre un débit fixe (100Mo/s par lien en fibre
optique). Les entreprises qui ont des applications critiques
nécessitant une haute qualité de service
opteront donc plutôt pour le SAN.
Disponibilité
: idem. Le SAN assure la redondance du stockage (c'est
à dire l'accessibilité au système
de stokage en cas de panne de l'un de ses éléments)
en doublant au minimum chacun des éléments
du système : les cartes HBA (Host Bus Adapter)
des serveurs, les commutateurs, et l'écriture
des données sur les disques. Le NAS lui ne permet
pas cette fonction vitale pour certaines applications
(type banquaires, assurances, sites de commerce électronique,
etc.)
Hétérogénéité
: on dit parfois que le NAS convient bien aux environnements
hétérogènes. Il serait plus exact
de dire que l'intéropérabilité
des éléments de stockage ne joue ici que
sur une variante majeure : l'OS du serveur de fichier,
qui selon qu'il sera Unix ou Windows, utilisera un protocole
NFS (Network File System) ou CIFS (Common Internet File
System). Le SAN multipliant le matériel de stockage
nécessaire (serveurs, mais aussi commutateurs
ou routeurs et baies de disques issues de constructeurs
différents), l'intéropérabilité
s'en trouve d'autant complexifiée.
Coût
: le NAS ne requiert pas de l'entreprise qu'elle mette
en place une infrastructure de câbles en fibre
optique (solution majoritairement adoptée pour
le SAN). Son prix est donc abordable pour des petites
entreprises ou des services départementaux de
grands groupes dont les volumes de données ne
sont pas trop importants. C'est en dernière instantce
un arbitrage entre coût et besoins qui doit décider
de l'intérêt d'une solution ou d'une autre.
A titre indicatif, au dessus d'une cinquantaine de ports
(trois commutateurs 16 ports), il est plus souvent plus
intéressant de passer au SAN.
On
présente iSCSI comme une voie médiane
entre NAS et SAN. Pourquoi ?
En fait iSCSI (Internet Small Computer System
Interface) est un hybride qui rend compatibles des protocoles
qui ne le sont pas naturellement : SCSI (le protocole
le plus utilisé pour le stockage) et TCP/IP (protocole
NAS), en encapsulant les données SCSI dans des
paquets IP. Ce qui permet à l'entreprise de s'adosser
à son existant. Revers de la médaille
cependant : les débits qu'offre cette solution
sont inférieurs à ceux de la fibre optique,
puisqu'ils sont indéxés au débit
des réseaux Ethernet, soit 10/100 Mbps aujourd'hui
(contre 1 voire 2 Gbts pour certains équipements
Fibre Channel). De toute façon, malgré
les premiers appareils présentés par Cisco
ou IBM, les spécialistes s'acccordent à
reconnaître que iSCSI ne s'imposera pas sur le
marché avant 2003, et ce dans le meilleur des
cas.
On
parle de plus en plus de "stockage sur IP"
: de quoi s"agit-il ?
On
peut résumer la situation en disant que le stockage
via IP (Internet Protocol) découle directement
des problématiques soulevées par le stockage
en réseau évoqué plus haut. Avec
le développement du NAS (et du SAN dans un moindre
mesure) qui met en réseau des serveurs et des
sous-systèmes de stockage, commence à
se poser le problème de leur interconnection
distante. En effet, les deux protocoles aujourd'hui
utilisés, Fibre Channel (FC) et SCSI reposent
sur des médias dont les capacités sont
physiquement limitées : les câbles en cuivre
utilisés pour SCSI ne peuvent dépasser
12 à 25 ms, tandis que ceux en fibre optique
sont limités selon les cas, à 500 ms (Fibre
Channel Short Wave, FC SW) ou 10 kms (dans le cas de
la Fibre Channel Long Wave, FC LW).
De
nouveaux protocoles sont en train d'apparaître
: FCIP, iFCP, iSCSI, Infiniband. Qui fait quoi ?
FCIP,
iFCP et iSCSI sont les trois protocoles qui existent
actuellement pour tenter de répondre au problème
- précisément - du stockage via IP. Chacun
d'entre eux possède cependant des sphères
d'applications bien spécifiques.
FCIP : est un protocole de tunneling destiné
à relier entre eux des réseaux SAN en
fibre optique géographiquement distants. FCIP
répond donc (ou tente de répondre) à
un problème d'interconnexion de réseaux
FC sur des longues distances.
iFCP se situe à un autre niveau que FCIP
: il sert à connecter non pas deux réseaux
entre eux, mais un périphérique de stockage
(serveur,
librairie de bandes, etc.)
doté d'une carte HBA (Host
Bus Adapter) FC directement à un réseau
SAN IP. Pour cela, iFCP remplace certaines couches basses
du protocole FC par TCP/IP.
iSCSI
nous l'avons vu, est un protocole d'encapsulation de
flux de données au format SCSI dans des paquets
IP, procédé grâce auquel iSCSI s'affranchit
des limites des réseaux en cuivre ou en fibre
optique.
Infiniband n'est en
revanche pas à proprement parler un protocole
de stockage sur IP. Il s'agit plutôt d'une architecture
d'entrée-sortie des serveurs (I/O), qui pourrait
remplacer à terme les bus PCI en offrant des
débits bien supérieurs (de 500 Mbps jusqu'à
6 Gbps avec la technologie 12X).
Quel
est le degré de maturité de ces nouvelles
technologies aujourd'hui ?
Aucun des ces trois protocoles
n'a à notre connaissance franchi le stade de
draft interne au sein de l'IETF (Internet Enginering
Task Force) et n'est passé en RFC (request for
comment). Toutefois, les avancées concrètes
de chacun sont variables.
iSCSI est indéniablement le protocole le plus
mature aujourd'hui, qui bénéficie du soutien
actif d'IBM , Cisco (qui a présenté il
y a quelques mois le 1er routeur supportant iSCSI, le
SN 5420), Adaptec ou HP notamment qui sont tous membres
du groupe de travail constitué autour de ce futur
standard. Aucun produit n'est pour le moment sorti de
la part des constructeurs qui soutiennent FCIP (Lucent,
QLogic, Compaq, Cisco, Gadzoox networks, Brocade, Mc
Data, etc.), non plus que de ceux qui se sont fédérés
autour de iFCP (Nishan Systems, Nortel Networks, Sun,
ADIC, Quantum, etc.). Quant à l'architecture
Infiniband qui regroupe IBM, Sun, Compaq et intel notamment,
sa première réalisation pourrait venir
d'une start-up américaine nommée Voltaire,
qui prévoit de lancer le 1er routeur IP-to-Infiniband
avant la fin du premier trimestre 2002.
On
entend parfois parler de "directors" par certains
fabricants. Existe-t-il une différence avec les
routeurs ordinaires ?
Le
terme est apparu sous la plume des services marketing
de deux grands fabricants de routeurs : Mc Data et Inrange.
Fonctionnellement, il sert à marquer une rupture
entre les routeurs d'entrée de gamme et de moyenne
gamme d'une part et les routeurs haut de gamme d'autre
part. Ces derniers incluent deux caractéristiques
: le support du 2 Gbps et du fameux "RAS"
(Reliability, Accessibility et Scaleability), c'est
à dire de fonctionnalités de redondance,
d'extraction à chaud, et d'ajout de logiciels
sans interruption du système. A noter que le
Silkworm 12 000 de Brocade, qui appartient de plein
droit à ce type de routeur haute disponibilité,
reste appelé "router" par son fabricant
et non "director".
|