Dossier Comparatif : 5 solutions d'archivage en mode cloud

Alternatives à l'archivage sur bandes magnétiques, les prestataires de cloud proposent des solutions de stockage de données "froides" ou "tièdes". Avec des contraintes et des tarifs très différents. 

Le cloud fournit une alternative aux services d'archivage froid qui reposent généralement sur des supports physiques comme les bandes magnétiques. A l'image de Glacier, l'offre d'Amazon Web Services (AWS) qui a ouvert ce marché en 2012, les solutions d'archivage en mode cloud sont conçues pour des conservations sur de longues périodes - 5, 10, 20 ou 50 ans - et pour des extractions peu fréquentes. Des données dites froides que l'on pousse et retire qu'exceptionnellement.

Le taux de disponibilité, cher aux autres services cloud, disparaît au profit d'un niveau de durabilité et de multiples réplications de données dans les data centers d'une même région ou de régions différentes. De même, les critères de performance liés au nombre de CPU ou de machines virtuelles n'existent plus.

"Plus une donnée est froide, moins son archivage revient cher"

"La dimension économique prend une place plus importante", observe Eric K'Dual, directeur associé de Neoxia et PDG de la filiale Skale-5. "Plus la donnée est froide et moins son archivage coûte cher. En contrepartie, le temps de récupération est mécaniquement plus long. Leur préparation peut prendre des heures sur de grosses archives."

Un comparatif difficile du fait de grilles tarifaires complexes

L'arbitrage entre les solutions d'archivage "froid" (comme AWS Glacier et C14 d'Online.net) et celles d'archivage "tiède" (Google Cloud Storage Nearline, Azure Cool Blob Storage ou OVH Object Storage) se fait en fonction de la température de la donnée et du temps d'accès souhaités. Avec 0,007 dollar par Go et par mois contre 0,01 pour Google Cloud Storage Nearline, Glacier est moins cher. En revanche, AWS facture plus lourdement après un certain volume d'extractions ou de données supprimées.

"Il s'agit de calculer les coûts de dépôt mais aussi de transfert et de rapatriement de données, ces derniers étant difficilement prédictibles", note Eric K'Dual. Le comparatif est rendu d'autant plus difficile que les prestataires de cloud complexifient sciemment leur grille tarifaire. Les prix sont en baisse constante, avec un fort taux de dégressivité, et varient selon les régions de réplication retenues. Avis aux férus des tableaux Excel ! En mars dernier, le consultant Richard Burley a tenté dans un tableau de comparer les offres d'Amazon, Google et Microsoft selon le volume de données au repos et celui en transit.

Opter pour plusieurs services de stockage en fonction des besoins

Pour Eric K'Dual, l'avenir se dessine en faveur d'un stockage tiède au prix du froid. Ce qui évacuerait le problème de temps de récupération des données. En attendant, il est possible d'appliquer des règles techniques pour gérer le cycle de vie de la donnée et optimiser les coûts sachant que Glacier est basé sur S3 pour AWS et Nearline sur Storage pour Google. "Une entreprise peut décider qu'au bout de 6 mois, une donnée devienne tiède, et que deux ans plus tard, froide. Elle peut aussi distribuer le risque entre plusieurs prestataires, le back-up pouvant être réalisé chez AWS et l'historique de données clients stockée chez Google", avance Eric K'Dual. De l'art de ne pas mettre tous ses œufs dans le même cloud.

Stockage