Gestion de l'infrastructure informatique : la garantie du "zero downtime" grâce au cloud

Quel est le meilleur moment pour effectuer un changement sur l'infrastructure IT, changement nécessaire et qui ne peut être reporté ? Et comment le combiner à la continuité des activités, qui exige que les systèmes fonctionnent à pleine capacité ?

Pour les responsables informatiques, l'un des moments les plus angoissants est celui des interventions de maintenance programmée qui laissent les systèmes temporairement inactifs. C'est pourquoi les modifications, même simples, à apporter aux systèmes constituent souvent un casse-tête pour les équipes IT et leur direction. Une grande partie de cette inquiétude ne découle pas du changement ou de la mise à niveau en soi, mais de l'impact que la période d’inactivité du réseau peut avoir sur l'activité de l’entreprise.

Le coût de ces arrêts de maintenance est énorme. Les responsables informatiques sont confrontés à un dilemme de taille : quel est le meilleur moment pour effectuer un changement sur l’infrastructure, changement nécessaire et qui ne peut être reporté, et comment le combiner à la continuité des activités, qui exige que les systèmes fonctionnent à pleine capacité, pratiquement en 24/7. Pour atteindre l'idéal du "zéro downtime" (pas de temps d’arrêt), les entreprises mettent en place des systèmes de secours actifs et/ou des infrastructures redondantes qui soutiennent son activité durant la phase de maintenance de l’infrastructure IT. Or, toutes ne peuvent pas se le permettre, et certaines doivent faire face à des ruptures d’activité et à une perte de productivité associée.

Dans la quête du "zéro downtime", le cloud peut devenir un allié de taille. Et ce pour tous types d'organisations, même pour celles en capacité de se doter de systèmes redondants, puisqu’il offre une gestion plus efficace, simplifiée et sécurisée. Correctement déployée, une plateforme cloud, toujours active, constituera un atout de sécurité supplémentaire.

Si vous gérez, par exemple, un million d'appareils dans un environnement multi-tenant, les temps d'arrêt ne sont tout simplement pas envisageables. Or, pour atteindre ce niveau de disponibilité totale, il faut modifier à la fois l'architecture et les méthodes de développement.

Le défi premier consiste à apporter des modifications aux bases de données de la plateforme, et la méthodologie varie selon le fait que les données soient structurées ou non. Les bases de données sur SQL, pour les données structurées, sont les plus sensibles. Une modification de leur conception peut entraîner des erreurs, à moins que l'application et la requête qu'elles effectuent ne soient en mesure de traiter correctement les différences dans la conception de la base de données. C'est pourquoi il était nécessaire de fermer l'application avant d'appliquer toutes mises à jour.

La révolution du cloud de quatrième génération

Les certifications de qualité (telles que la norme ISO 27001) exigent que tous les changements soient documentés tout comme les modifications proposées par les développeurs.

Avec cette évolution du cloud, la compatibilité est assurée. Les modifications apportées sont compatibles avec celles opérées via des versions ultérieures. Chaque ligne de code de l'application qui s'exécute dans une base de données doit tenir compte du fait qu'elle peut interagir avec un nouveau modèle et doit le traiter en conséquence. En outre, les bases de données utilisées doivent être rétro-compatibles, afin que l'ancienne application puisse continuer à fonctionner pendant l’upgrade. Grâce à toute cette procédure, un ‘temps d'arrêt zéro’ dans les processus de maintenance et de mise à jour peut facilement être atteint.

Comment ?

La première étape consiste à appliquer aux bases de données actives des mises à jour entièrement testées et autorisées, créant ainsi une version "N+1" de ladite base. En attendant, grâce à la rétrocompatibilité conçue, la version précédente de la plateforme Cloud continue de fonctionner en utilisant le nouveau modèle de la base de données. La rétrocompatibilité du nouveau schéma "N+1" permet ainsi d'accepter et de traiter de nouvelles transactions à partir de l'ancien format d'application.

Les mises à jour sont ensuite appliquées. Dans le cloud de quatrième génération, cela implique le déploiement et l'échange de nouveaux containers qui sont orchestrés par une infrastructure Kubernetes. Cela se fait de manière simple, en remplaçant une partie des pods Kubernetes opérationnels et en apportant les connexions actives à ces instances updatées. Les pods restants sont ensuite mis à jour, créant une version d'application "N+1" qui est connectée à la nouvelle conception de la base de données de support.

Enfin, des routines de nettoyage et d'entretien de la base de données sont appliquées pour établir la nouvelle norme tant pour l'application que pour la base elle-même. Dans une plateforme de gestion de cloud complexe et de grande envergure, de nombreux éléments sont en mouvement. Avec une bonne orchestration, il devient possible de réaliser une mise à niveau de la plateforme sans temps d’arrêt avec une réelle continuité d’activités et ce en tout en préservant la sécurité de l’infrastructure, un challenge de plus en plus capital.