Bug d'Hotmail : Microsoft reconnaît et explique ses torts

Des tests de monitoring mal automatisés sont à l'origine du dysfonctionnement que Microsoft a tardé à repérer puis corriger. Explication technique de l'incident.

Dans le blog Inside Windows Live, Mike Schackwitz (de l'équipe Hotmail) fait toute la lumière sur les mails disparus le 31 décembre sur Hotmail. Afin de contrôler la qualité de son service, Microsoft explique utiliser des tests automatisés pour simuler l'activité d'un utilisateur normal sur de faux comptes créés à cet effet. Des scripts créent et suppriment ces comptes d'essai. Ces comptes de test sont supprimés à partir d'un groupe de serveurs d'annuaire qui routent aussi les utilisateurs et les courriers entrants aux bonnes boites mails.

"Le 30 décembre, nous avons eu une erreur dans le script qui a par inadvertance enlevé du répertoire un petit nombre de comptes d'utilisateurs réels en même temps que des comptes de test", détaille Mike Schackwitz. Les mails des utilisateurs touchés n'ont pas été supprimés : seule leur boîte de réception dans les serveurs d'annuaire a été retirée.

Par conséquent, quand ces utilisateurs se sont connectés, une nouvelle boîte aux lettres a été créée automatiquement sur un nouveau serveur de stockage. Ce dernier  ne contenait donc pas leurs anciens messages. C'est aussi pourquoi ces comptes ont reçu un message de "Bienvenue dans Hotmail."
 

Microsoft modifie son processus de test des comptes Hotmail

Microsoft  admet par ailleurs que "ces équipes de support étaient au début incapables de remonter à la source du problème". Le 31 décembre un ticket sur la question a été inscrit dans son système d'alerte.

 "Dans un premier temps nous n'avons pas attribué ce problème à la bonne équipe", notamment "parce que le volume des rapports n'était pas assez élevé pour déclencher des alarmes", explique l'éditeur. Après avoir restauré les comptes des utilisateurs concernés dans les serveurs d'annuaire le 2 janvier, Microsoft a ensuite dû fusionner leurs anciens e-mails avec les nouveaux messages qu'ils avaient reçus après l'incident.  Le 5 Janvier, les 17 355 comptes concernés fonctionnaient normalement.

Microsoft indique avoir depuis changé sa façon de faire : le code de suppression des comptes d'essai empruntera désormais un chemin différent. "De sorte que nos tests ne risquent plus de toucher des comptes d'utilisateurs réels", indique le groupe.