Les facteurs clés du succès d’un déploiement d’une base de données sur un cloud hybride

Les architectures de cloud hybrides viennent de franchir un cap. En passant du statut de concept porteur à celui de norme au sein des entreprises. Ce marché devrait connaître d’ici à 2019 une croissance annuelle de 27,3% et peser plus de 80 milliards d’euros.

Lors d’une de ses grandes conférences consacrées aux nouvelles technologies, le groupe Gartner s’est aperçu que près des trois quarts des grandes entreprises présentes envisageaient de se doter d’une architecture de cloud hybride d’ici la fin de l’exercice 2015, soit 25 % de plus que celles qui affichaient cette même intention un an plus tôt. S’ajoute à cela le fait que la quantité de données stockées sur les déploiements de cloud hybride est en passe de doubler de volume dans les deux prochaines années.

Pourquoi le cloud hybride suscite-t-il un tel engouement aujourd'hui ?

Les architectures de cloud hybride reposent sur un mélange entre opérations sur site et service sur le l’hébergement, et orchestrent les échanges entre les deux plateformes. Parmi les entreprises modernes qui se tournent aujourd'hui vers le cloud hybride, beaucoup sont attirées par la possibilité d’étendre les ressources de leur infrastructure en cas d’extrême nécessité (en cas de « coup de feu »). La prévention des incidents ou encore le transfert de la responsabilité du hardware et de l’opérationnel vers d’autres professionnels et centres de coût représentent également une alternative. 

Les motivations qui sous-tendent d’ordinaire l’adoption d’une structure de cloud hybride sont parfaitement résumées par Mike Maples, associé du fonds d’investissement FLOODGATE de Palo Alto. Selon lui, « les services informatiques commencent aujourd'hui à rationaliser le cloud comme un simple élément d’une infrastructure. Bien sûr, il n’est pas question de transférer l’ensemble des informations qui concernent l’entreprise sur le cloud. Il ne s’agit pas de raisonner dans l’absolu. À l’heure où le monde devient de plus en plus hybride, l’approche à adopter requiert un certain discernement. »

Concernant le fonctionnement et la gestion des activités des bases de données dans ce type d’environnement, force est de constater que trois prérequis reviennent systématiquement dans les architectures de cloud hybride. Ces impératifs peuvent se traduire sous la forme de trois questions qu’il convient de se poser si l’on envisage de déployer une base de données dans un environnement de cloud hybride :

1 : Quel est le degré de complexité de l’opération ?

Avant de faire fonctionner une base de données dans une configuration de cloud hybride, il importe d’évaluer la difficulté pour la base de données de fonctionner sur un ou plusieurs datacenters de cloud public et privé. Si l’objectif de l’opération est de permettre à une base de données d’utiliser un cloud public comme le ferait tout autre élément de l’infrastructure IT de l’entreprise, cette dernière voudra certainement faciliter au maximum l’intégration d’un ou plusieurs clouds à l’architecture de connexion d’une base de données.

De l’architecture qui sert de socle à une base de données va dépendre étroitement le degré de simplicité du déploiement et du fonctionnement d’un système de cloud hybride. Premièrement, une architecture de base de données masterless, c'est-à-dire non supervisée qui voit toutes les installations et instances fonctionnelles du logiciel de la base de données harmonisées, sera plus simple à faire fonctionner et à administrer qu’un système de type maître-esclave. En effet, l’architecture de ce dernier implique quasi systématiquement que certaines parties soient dévolues à diverses activités et fonctions : certaines gèreront par exemple l’écriture des opérations, tandis que d’autres se chargeront exclusivement de la lecture ou du basculement. Cela complique sa prise en main et risque de se traduire par des résultats décevants en matière de répartition des données à travers de vastes zones géographiques.

L’architecture sur laquelle repose une base de données est intimement liée à ses capacités de réplication, ce qui peut également compliquer nettement le fonctionnement et la maintenance du déploiement. L’un des avantages d’une architecture de base de données sur un cloud hybride est de pouvoir posséder plusieurs exemplaires des données dans divers lieux, ce qui permet (1) d’obtenir des performances uniformes quel que soit l’endroit où se trouve l’utilisateur web ou mobile ; (2) de garantir la continuité du service et de prévenir les pannes au niveau de la base de données  contrairement aux bases de données centralisées existantes ; (3) de permettre aux opérations d’écriture et de lecture de s’exécuter depuis n’importe où ; (4) de conserver certaines données sur le réseau local, d’autres exclusivement sur le cloud, et d’autres sur les deux, de façon à remplir les obligations légales et les besoins de l’entreprise.

Comme on pouvait s’y attendre, l’une des principales sources d’inquiétude concernant le sort réservé aux données dans une configuration cloud hybride tient à la façon de déplacer intelligemment des données entre le matériel sur site et les fournisseurs de service cloud pour atteindre ces objectifs. L’association d’une architecture masterless dotée de capacités de réplication flexibles permettant aux opérations de lecture/écriture de s’exécuter depuis n’importe où, l’aptitude de répliquer certaines données localement et sur le cloud et de veiller à ce que les données soient, constamment synchronisées, où qu’elles soient hébergées, simplifie considérablement l’administration d’une base de données sur un cloud hybride.

Enfin, des outils de gestion et de surveillance devraient permettre d’incorporer sans heurts toute machine opérant la base de données sur le cloud au matériel sur site hébergeant la même base de données. Aux yeux de l’outil, les machines hébergées sur le cloud devraient apparaître comme tout autre datacenter de l’infrastructure informatique de l’entreprise.

2 : Dans quelle mesure l’architecture est-elle évolutive ?

L’un des grands attraits du cloud hybride est sa capacité à évoluer rapidement pour satisfaire la hausse rapide de la demande des utilisateurs, pour telle ou telle application, ou l’augmentation des volumes de données. La clé est d’éliminer les ressources informatiques en sommeil et d’étendre ou de réduire dynamiquement l’architecture d’une base de données afin que ses capacités correspondent à la demande actuelle ou prévisionnelle.

Aussi séduisante que soit cette idée, planifier l’évolution d’une base de données partagée entre les locaux d’une entreprise et un cloud n’est pas chose aisée. Il faut prendre le temps d’éplucher dans le détail les diverses offres de DBaaS qui, bien que promettant un service aisément modulable, ne présentent pas nécessairement les gages de performances et de modularité requis pour pourvoir à l’accroissement des besoins d’applications web et mobiles pour peu qu’elles rencontrent un grand succès.

Ici aussi, l’architecture de la base de données va influencer directement sa capacité à évoluer entre datacenters privés et fournisseurs de cloud. Être à même de prédire avec fiabilité les augmentations du volume des ventes avec une architecture masterless requiert la plupart du temps un simple calcul, ce qui n’est pas le cas avec les autres formats de bases de données. Si, dans le cas des bases de données masterless à l’instar d’Apache Cassandra, l’évolutivité linéaire via l’augmentation du nombre de nœuds pour les opérations de lecture comme d’écriture est quasiment garantie, les bases de données reposant sur une architecture maître-esclave ne permettent pas d’échafauder de telles prévisions.

3 : Quels sont les risques en matière de sécurité ?

Nul ne s’étonnera que la sécurité figure en tête des préoccupations des entreprises qui envisagent de se doter d’une architecture de cloud hybride. Comme le montrent diverses études, près de 70 % des professionnels craignent ainsi que la migration d’une partie de leur base de données vers un cloud augmente les risques d’intrusion de tiers non autorisés. Alors que d’autres redoutent les risques traditionnellement associés à ce type de technologies : compromission d’un compte utilisateur, présence de programmes malveillants sur le cloud, exposition excessive des données et vulnérabilité des informations à caractère nominatif.

Pour dissiper ces craintes, la base de données destinée à être hébergée sur le cloud hybride doit être dotée d’un système de sécurité professionnel capable de garantir les mêmes niveaux de protection et de gestion de la sécurité quel que soit le site sur lequel les données sont hébergées. Des systèmes de cryptage devront être utilisés pour toutes les données transférées sur le réseau, entre les nœuds, et au repos. De même, il conviendra de mettre en place un mécanisme interne ou tiers (comme LDAP, Kerberos, etc.) d’authentification et d’autorisation des accès sur tous les sites. Enfin, des fonctionnalités de contrôle intelligent devront être installées de manière à ce qu’il soit possible de surveiller l’accès à la base de données tant depuis le cloud que depuis les locaux de l’entreprise. Tous ces contrôles de sécurité devront fonctionner harmonieusement dans l’ensemble de l’architecture de cloud hybride.

Au-delà de la gestion de la sécurité, un autre aspect qui revêt une importance croissante mérite une attention accrue de la part des entreprises : la souveraineté des données (aussi appelée résidence des données). Derrière ce nom se cache l’idée que les données stockées sont assujetties aux lois des pays dans lesquels elles sont hébergées.

Bien des questions relatives à la souveraineté des données tournent autour de l’application des règles encadrant les informations personnelles et la prévention de la saisie de données stockées à l’étranger sur injonction des autorités du pays hébergeur. Les technologies du cloud et du cloud hybride ont fait tomber les frontières géopolitiques qui prévalaient jusqu’alors et poussent de multiples pays à ajouter à leur arsenal législatif de nouvelles règles de conformité qui imposent que l’hébergement de données sensibles soit confiné au pays dont elles proviennent.

Les dernières lois adoptées par l’UE prévoient de lourdes sanctions en cas de non-respect des textes encadrant la souveraineté des données. Ainsi, les entreprises qui enfreignent ces règles sont passibles d’amendes pouvant atteindre jusqu’à 4 % de leur chiffre d’affaires. Ce qui, pour des multinationales du web, peut représenter des milliards.

Dans le cas d’une base de données déployée sur un cloud hybride, respecter les prescriptions relatives à la souveraineté des données revient à avoir la flexibilité de conserver au niveau local les données qui doivent l’être au regard de la loi. Cela permet la libre circulation des données qui ne sont pas concernées par ces obligations légales entre différents clouds installés dans d’autres zones géographiques.

Pour ce faire, il suffit de contrôler les données au niveau des espaces de clés, ce qui permet de confiner aisément aux datacenters locaux celles qui sont assujetties aux réglementations de souveraineté, tout en permettant que les autres données soient stockées dans différents espaces de clés qui permettent leur réplication entre les datacenters locaux et les cloud retenus.

Conclusion

On l’aura compris, le cloud hybride semble aujourd'hui bien parti pour devenir la norme. Eu égard au fait que la base de données est au cœur de chaque application ou presque, il est donc essentiel de veiller à ce que celle que l’on envisage de transférer sur une architecture de cloud puisse être aisément utilisée dans ce type d’environnement, mais aussi de s’assurer qu’elle puisse s’adapter en fonction des prévisions et présente toutes les garanties requises en matière de sécurité des données.

Simplicité, évolutivité et sécurité constituent le fondement d’une base de données à l’architecture solide, qu’elle soit sur un cloud hybride ou non. Comme le dit Maples, « au bout du compte, les clients et les utilisateurs n’ont que faire du cloud. L’important, pour eux, c’est de faire leur travail. En tout état de cause, les performances et la commodité propres au cloud hybride sont sans commune mesure avec celles d’une approche du cloud qui ne ferait aucun compromis. »