Une erreur humaine à l'origine de la panne d'Amazon EC2

Une mauvaise manipulation d'un opérateur est à l'origine de la panne d'Amazon le 21 avril dernier. Les clients touchés auront droit à 10 jours de service gratuit.

On connaît désormais l'origine de la panne d'Amazon du 21 avril dernier qui a causé la disparation de 0,07% des données hébergées dans le service de Cloud Computing du groupe américain. Le fournisseur a en effet révélé des informations concernant la gigantesque panne qui a frappé une grande partie de son réseau à l'Est des Etats-Unis

Un problème a en effet été rencontré lors d'une mise à jour d'un système de sauvegarde redondant lié aux serveurs situés dans le service Elastic Block Stores (EBS).

"Une des premières étapes de la mise à jour est de router le trafic vers des routeurs redondants dans le réseau EBS primaire pour permettre la mise à jour. Le routage a été effectué de façon incorrecte, au lieu d'être aiguillé vers des routeurs situés sur le réseau principal, le trafic a été routé sur le plus petit réseau EBS redondant", explique Amazon dans un document de synthèse mis en ligne pour l'occasion.

Promettant d'auditer à l'avenir ses procédures de mises à jour, accroître leur automatisation et concevoir de nouveaux logiciels et services pour éviter les pannes, Amazon à pour l'heure décidé de dédommager ses clients touchés par l'incident. 10 jours de crédits vont leur être accordés, correspondant à 100% de leur usage en termes de volumes EBS, instances EC2 et instances de bases de données RDS affectées par la panne de service.