Stockage en mode cloud : comment Backblaze casse les prix ?

Avec B2, le spécialiste de la sauvegarde personnelle se lance dans le stockage dans le cloud. Avec des tarifs défiants toute concurrence, inférieurs même à ceux d'Amazon. Comment a-t-il réussi ce tour de passe-passe ? Le point.

Le prix de l'archivage froid avec la performance des services de stockage traditionnels. C'est le tour de force qu'a réussi l'Américain Backblaze avec son nouveau service B2, commercialisé cet été. Avec un tarif de 0,005 dollar par Go et par mois, ce service de stockage dans le cloud est quatre fois moins élevé que S3 d'Amazon Web Services (AWS). Il arrive même à être inférieur à Glacier (0,005 dollar par Go et par mois), la solution d'archivage d'AWS qui, comme son nom l'indique, se destine aux données dites froides que l'on récupère qu'exceptionnellement.

La contrepartie du stockage froid, c'est le temps de récupération des données. Pour AWS Glacier qui fait appel à des technologies de sauvegarde sur bandes magnétiques, il faut compter de 3 à 5 heures, le temps de chercher et de charger l'archive. Avec des supports sur disques, B2 propose, lui, une récupération quasi immédiate. Pour ce niveau de performance, Google facture 0,01 dollar par Go et par mois pour Cloud Storage Nearline et Azure 0,01 euro pour Cool Blob Storage. B2 peut-être testé sans avoir à sortir sa carte bancaire, Backblaze offrant 10 Go de stockage. Si l'upload est gratuit, le téléchargement est facturé 0,05 dollar par Go (avec 1 Go gratuit par jour).

25 millions de Go uploadés

Backblaze n'est pas une inconnue. Créée en 2007 par des anciens ingénieurs d'Apple, la société de San Mateo (Californie) s'est rendue populaire en proposant des solutions de back-up en ligne en illimité à raison de 5 dollars par mois et par ordinateur pour une sauvegarde personnelle, et de 50 dollars par an et par ordinateur pour les entreprises. Ces services ont préparé le terrain à cette offre B2 qui, durant sa période de bêta, a été prise en main par 30 000 utilisateurs - qui ont uploadé 125 millions de fichiers, soit plus de 525 To de données.

Une infrastructure optimisée à tous les niveaux

Pour Guillaume Delaporte, co-fondateur d'OpenIO qui édite une solution open source de stockage distribué, "Backblaze, c'est d'abord une belle alchimie. La société a optimisé son infrastructure à tous les niveaux pour arriver à ces prix défiant toute concurrence. A la différence des grands prestataires du cloud, Blackbaze ne propose qu'un seul service, la sauvegarde et l'archivage. La société est restée à taille humaine avec des compétences très pointue", analyse l'expert.

Interface d'administration de Backblaze © Capture JDN

Son propre design de rack de disques durs

Backblaze, qui revendique 25 millions de Go stockés, a tout d'abord conçu son propre hardware pour créer des serveurs à haute densité et à moindre coût. Son unité stockage, baptisée Storage Pod, comprend 60 disques durs dans un rack au format 4U (7 pouces). Tout est passé en revue, de la carte mère (Supermicro MBD-X9SRH-7TF) au processeur à quatre cœurs (Intel Xeon E5-1620 V2) en passant par le contrôleur SATA (PCIe x2 à 1 000 Mo/s).

Des spécifications disponibles en open source

Blackbaze procède par itérations successives pour affiner son Storage Pod. Dans la version 6 de son offre, sortie en avril dernier, la capacité de stockage a été augmentée de 33%. Le design de Storage Pod étant publié en open source, Shutterfly et Netflix se sont inspirés de son modèle. Backblaze a aussi créé sa propre couche logicielle pour surveiller les Storage Pod, piloter l'allocation du stockage de données, et choisir la façon de les chiffrer, les dupliquer et les indexer. Le prestataire s'appuie pour cela sur des logiciels libres, notamment Debian et Apache pour connecter les Storage Pod à son réseau, et fdisk sous Linux pour créer une partition par lecteur.

Une architecture de disques durs en grappes

Pour son architecture dite Vault, Backblaze aligne dans son data center ses Storage Pod par grappes de 20. Chaque rack ayant les mêmes dimensions et les mêmes performances, il est possible de créer des unités de stockage transverses de 20 disques durs, baptisées "tomes". Un même fichier est ainsi fractionné et réparti au sein de ces tomes afin de garantir son intégrité et sa disponibilité. Backblaze utilise ses propres codes correcteurs d'erreurs dits de Reed-Solomon pour survenir aux défaillances. Le stockage ou la récupération se fait uniquement via HTTPS. Pas d'iSCSI, de NFS, de SQL ou de Fiber Channel. Avec cette architecture, Backblaze garantit avec une intégrité annuelle des données de 99,99999%. Un niveau peu moins élevé toutefois que celui d'AWS Glacier - qui est de 99,999999999%.

Version 6.0 du serveur Storage Pod. © Backblaze

Pour Guillaume Delaporte, Backblaze offre une alternative à l'archivage sur bandes tout en ouvrant la voie à d'autres cas d'usage. "B2 peut servir par exemple à gérer des débordements pour étendre le stockage local ou dupliquer des sauvegardes en interne et dans le cloud public", commente-t-il. Dans le cadre d'un partenariat noué en juin dernier avec Backblaze, OpenIO propose une passerelle optimisée pour B2 afin de faire du multi-tiering. Avec cette offre conjointe, "il est possible d'appliquer des règles de type 'au bout d'un an, ma donnée sort de mon cloud privé pour aller sur B2'. Je garde la donnée chaude près de moi et envoie la donnée froide dans le cloud public", précise-t-on chez OpenIO.

Stockage / Datacenter