Cas utilisateur
 
04/12/2007

L'Institut Pasteur met le cap sur les 100 To de stockage

Equipé en serveur de fichiers NAS, l'organisme a monté en grappe deux systèmes Network Appliance. Une solution qui se veut robuste et évolutive face à la croissance rapide des besoins utilisateurs.
  Envoyer Imprimer  

 
En savoir plus
 
 
 

Fondation de droit privé, l'Institut Pasteur a pour mission la recherche en microbiologie appliquée à la santé. On lui doit notamment le vaccin contre le rage. L'organisme emploie 2500 personnes dont la moitié sont des chercheurs permanents, et beaucoup de stagiaires présents pour de courtes durées. Implanté sur un site unique sur Paris, l'Institut Pasteur est toutefois amené à communiquer régulièrement avec une trentaine de sites indépendants chargés de la recherche sur le terrain.

Présents à Madagascar, aux Antilles et au Vietnam, ces laboratoires expédient à l'Institut Pasteur des banques de données à traiter. L'informatique et le réseau jouent donc un rôle déjà conséquent aujourd'hui, et qui devrait encore se renforcer à l'avenir.

"La recherche en biologie est en train de passer du tout expérimental, à quelque chose de plus tourner vers l'informatique. Nous travaillons par exemple beaucoup autour de l'ADN, et ce genre de données s'informatise assez bien. De même pour le travail sur l'imagerie médicale. Aujourd'hui, environ 15% de nos recherches s'effectuent par le biais de l'informatique. Dans les 5 à 10 ans qui viennent, il est possible que nous arrivions à 50%", indique Marc Baudoin, responsable systèmes et réseaux de l'Institut Pasteur.

Le travail sur les banques de données (génomiques) et l'imagerie allant en s'amplifiant, et les chercheurs devant conserver ces données un certain temps, les besoins en stockage se sont peu à peu accrus. A l'origine équipé de baies SCSI durant les années 95-99, l'Institut Pasteur passe au début des années 2000 sur un système NAS de marque NetApp.

"Nos données doivent être accessibles en lecture et en écriture simultanément"

"Nos données doivent être accessibles en lecture et en écriture simultanément. Le SAN ne convient pas du tout à notre activité. Nous avons besoin de capacité et de performance : pour pouvoir stocker beaucoup d'informations et répondre vite. En 1999, quand nous avons regardé le marché, il n'y avait pas beaucoup d'acteurs à proposer ce type de solutions. Nous sommes allés voir un client de NetApp, qui nous a convaincu", explique Marc Baudoin.

L'Institut s'équipe alors d'un serveur de fichiers de 500 Go, qu'il fait passer à 1 To l'année suivante. Quatre générations de serveurs NetApp plus tard, la direction informatique est passée d'un espace de stockage de 450 Go maximum en 1999, à 23 To de données stockées aujourd'hui (dont 20 To proviennent des utilisateurs).

La solution sert en effet pour les 4000 PC et la cinquantaine de serveurs du parc informatique. Pour s'assurer une évolutivité de son système, la direction système et réseau dispose de deux modèles FAS 980 en grappe avec deux contrôleurs. De fait, si l'un d'eux tombe en panne, l'autre est capable de prendre le relais. Dessus fonctionnent 10 baies dotées chacune de 14 disques pour un total de 140 disques de 400 Go Fiber Channel en RAID 6 double parité de technologie propriétaire.

"Nous prévoyons encore une extension des besoins des utilisateurs l'année prochaine pour approcher les 100 To de données stockées. Nous prendrons peut être alors une partie des disques en SATA si l'imagerie représente une majeure partie de ce nouveau volume comme nous le supposons. Ce type de données aura moins besoin de performances que les applications de génomie. A court terme, nous apercevons même des besoins d'archivage pour les informations peu consultées et qui pourraient être transférées sur bandes", souligne le responsable système et réseau.

"A court terme, nous constatons des besoins d'archivage pour les informations peu consultées"

L'évolution du système de stockage a simplifié le travail des utilisateurs, qui il y a un an, ne pouvaient pas stocker sur un tel système leurs données. Seuls les serveurs étaient sauvegardés ainsi. Désormais, les chercheurs ont un accès direct et sécurisé au serveur de fichiers, mais la sauvegarde n'est toutefois pas automatisée. "Il est compliqué, même en sauvegarde incrémentale, de récupérer les données mises à jour sur 4000 postes différents chaque soir", déclare Marc Baudoin.

Avant la mise en production, l'équipe système et réseau avait pratiqué des tests de montée en charge en interne, et mesuré à 100 000 le nombre d'opérations par seconde réalisables par le système NAS. Aujourd'hui, la solution NetApp fonctionne par jour à seulement 20 000 opérations par seconde. De même, simplement en rajoutant des disques, il est possible de monter les baies actuelles jusqu'à 96 To. Un travail préventif, au vu du rythme élevé d'évolution des besoins utilisateurs.

 
En savoir plus
 
 
 

Pour la mise en production du cluster, l'Institut Pasteur a fait appel au partenaire APX, de manière à gagner du temps. Après avoir réalisé la maquette et les tests, la migration s'est réalisée en quelques heures un matin sans problème. La configuration de l'installation est toujours opérationnelle, et aucune optimisation a posteriori n'a été nécessaire.

Une satisfaction à tous niveaux, "même si les prix sont élevés", note Marc Baudoin. Du coup, l'Institut Pasteur suit également la progression de la concurrence, que ce soit chez EMC ou sur de plus petits acteurs innovants.

 

 
Le projet en bref
 
  Organisme Institut Pasteur  
  Type de projet stockage  
  Choix de la solution Network Appliance  
  Date de début du projet 1999  
  Date de mise en production 2000  

 


JDN Solutions Envoyer Imprimer Haut de page

Sondage

Recourir à un service cloud comme unique solution de stockage de fichiers, vous y croyez ?

Tous les sondages