OVH victime d'une panne réseau d'une heure le 30 mars

OVH victime d'une panne réseau d'une heure le 30 mars Aux alentours de 17h30 ce lundi 30 mars, le backbone du groupe a été touché par un incident. De nombreux sites web hébergés sur son infrastructure se sont retrouvés inaccessibles.

[Mis à jour le lundi 30 mars 2020 à 19h15] A environ 17h30, OVHCloud a essuyé un incident sur son backbone réseau impactant l'accès à de nombreux sites web hébergés sur son infrastructure. L'offre de serveurs dédiés Soyoustart a notamment été touchée. "Nous avons escaladé cet incident auprès du constructeur avec la plus haute sévérité afin de diagnostiquer et de normaliser la redondance. Actuellement, le fonctionnement de notre réseau est revenu à la normal", précisait OVH sur sa plateforme de suivi d'incidents à 18h59.  Le groupe ajoutait à 19h22 : "Cet incident réseau a affecté les services de nos data centers de Roubaix de 17h01 à 17h40. Tous les services semblent maintenant être restaurés et nos équipes travaillent maintenant à assurer la récupération complète." Entre 17h40 et 18h30 le même jour, le service de monitoring Downdetector détectait environ 6 000 problèmes sur l'infrastructure d'OVH.  

Les principaux clouds français sont en guerre. OVH, Scaleway et 3DS Outscale ont tous les trois mis dès le 16 mars les grands moyens pour faire face à l'épidémie de Covid-19 et à un potentiel impact de cette dernière sur leur activité. Au-delà des mesures de confinement en télétravail, ils doivent également composer avec les difficultés de leurs fournisseurs d'équipements et composants informatiques, en majorité originaires de Chine. Pour autant, les trois acteurs se disent "sereins" sur leur capacité à assurer la continuité des opérations, et à gérer le surcroît de trafic sur les applications de leurs clients les plus sollicitées (systèmes de communication, collaboration, sites d'e-commerce...).

"OVHcloud dispose d'une réserve de serveurs de plusieurs semaines en data center"

"Nous disposons d'une réserve de serveurs de plusieurs semaines en data center pour répondre à la majorité de la demande, y compris en cas de pic", confirme François Sterin, directeur industrie d'OVHcloud, qui a la particularité d'assembler lui-même ses machines. "Nous avions aussi anticipé en allongeant l'horizon de commande sur certains composants clés ces dernières semaines. Jusqu'à présent, nous avons pu être livrés de façon journalière et avons toujours plusieurs semaines d'avance". Le groupe roubaisien a constaté une hausse de la charge sur ses infrastructures depuis le 16 mars. "Nous avons mobilisé nos ressources pour être en mesure d'y répondre", ajoute François Sterin. Et Octave Klaba, CEO d'OVH d'enchaîner : "On livre 400 à 600 serveurs par jour, soit 12 à 15 baies de matériels pour permettre aux sites web critiques de rester fluides"

Des stocks de serveurs pour voir venir

Du côté du cloud d'Iliad, des précautions ont été prises dans le même sens. "Nos stocks de matériels serveur et réseau sont pourvus pour plusieurs mois", rassure Arnaud de Bermingham, président de Scaleway. "Pour l'heure, nous observons un trafic quotidien globalement supérieur à la normale, mais qui reste limité." Et Yann Lechelle, directeur général de Scaleway, d'ajouter : "Nous avons avancé les plannings de déploiement qui étaient prévus pour avril pour déployer un maximum de ressources en vue de palier tout pic inattendu."

"Nous avons réalisé un test grandeur nature, dès le jeudi 4 mars, en mettant tout l'effectif en télétravail"

Quant à 3DS Outscale, il bénéficie des process mis en place dans le cadre de sa certification ISO 27017 recouvrant l'intégralité de son offre. "Elle nous oblige à prévoir nos besoins et notre approvisionnement en capacités IT. Nous définissons un capacity planning à six mois. C'est un travail que nous réalisons en collaboration avec nos clients en fonction de leurs propres prévisions et de leurs projets de développement en cours", détaille David Chassan, directeur de la communication de 3DS Outscale. Comme chez AWS, les clients du provider de Saint-Cloud ont aussi la possibilité de réserver des instances, pour une période de trois ans par exemple. "Cette offre qui permet des économies jusqu'à 60% est également pour nous un levier de prévision", complète David Chassan.

En matière de RSE (responsabilité sociétale des entreprises), 3DS Outscale est par ailleurs normalisé ISO 26 000. Une certification dont ne dispose pas ses deux concurrents, et qui s'avère avoir été un outil clé. "Impliquant de prendre en compte la santé des salariés, clients et partenaires, elle nous a incité à lancer dès le 2 mars un plan de prévention pandémie. Une cellule a été mise en place pour adapter nos process et notre organisation. Dans la foulée, nous avons réalisé un test grandeur nature, dès le jeudi 4 mars, en mettant tout l'effectif en télétravail. Ce qui nous a permis de régler les derniers problèmes", relate David Chassan. Après les attentats de Paris fin 2015, 3DS Outscale avait équipé ses salariés d'ordinateurs portables et connexions sécurisées pour anticiper un potentiel blocage de ses bureaux suite à une situation d'urgence. Les employés étaient donc depuis longtemps préparé à la bascule qui a été réalisée mi-mars. Sur le plan de la sécurité, 3DS Outscale affiche en parallèle la certification ISO 27001, ainsi que le très sélect label Secumcloud décerné par l'Agence française de la sécurité des systèmes d'information, qu'il est pour l'heure le seul IaaS à avoir décroché.

"Nos techniciens sont isolés les uns des autres avec des centaines d'interventions à réaliser chaque jour. Ce sont les héros de la situation"

Dès le 16 mars, OVH et Scaleway prenaient eux- aussi le chemin du télétravail. Répartis dans 6 pays, les 15 bureaux d'OVH sont concernés, c'est-à-dire pas moins de 1 300 salariés (50% de l'effectif). "Nous prévoyons que l'ensemble de ces bureaux soient fermés avant la fin de la semaine. Ceci vaut pour tout notre support client qui sera entièrement équipé pour assurer la continuité du service client", souligne François Sterin. Côté Scaleway, les deux principaux bureaux, Paris et Lille, sont déjà vides.

Qu'en est-il des mesures prises pour assurer la sécurité sanitaire des techniciens dans les data centers ? Une question évidemment cruciale en vue de gérer la continuité d'activité des applications qui y sont hébergées. "Au sein de nos centres de données, nous avons mis en place des mesures de prévention renforcées en particulier sur le respect des distances de sécurité", pointe François Sterin. Objectif : réduire "au strict minimum" les interactions entre les techniciens en charge des opérations 24h/24 et les autres collaborateurs présents sur les sites. Hébergé dans les data centers de Digital Reality, Equinix et Telehouse, 3DS Outscale privilégie les interventions à distance en s'appuyant sur les équipes de ces trois fournisseurs. Pour éviter tout risque de contamination, Scaleway a fermé ses centres de données aux clients et mis en place des plannings séquentiels pour éviter la co-activité. "Nos techniciens sont ainsi isolés les uns des autres et travaillent seuls avec des centaines d'interventions à réaliser chaque jour. Ce sont les héros de la situation", insiste Arnaud de Bermingham. A l'heure où l'Hexagone est en confinement, les clouds français semblent bel et bien avoir pris la mesure de leurs responsabilités à maintenir les services numériques hébergés chez eux.

Précision : OVH est aussi certifié ISO 27001 et ISO 27017 pour son offre Private Cloud. Cette dernière est également en cours d'obtention du label SecNumCloud.