Données non structurées et stockage objet cloud : une alliance idéale

Qu'il s'agisse d'un patient qui attend ses radios, d'un joueur de jeux vidéo en pleine partie sur Twitch, ou d'un agent des forces de l'ordre qui analyse des vidéos de surveillance pour interpeller un voleur - l'avenir de la donnée non structurée est florissant.

80 % de l’ensemble des données mondiales sont des données est non structurées. En raison du flux de données toujours plus massif de l’Internet des Objets (IoT), Et ce n’est qu’un début. IDC prévoit d’ici 2025 une hausse de 28,7 % du taux de croissance annuel. 

Les défis à relever sont nombreux. Pour répondre à l’appétit vorace de la consommation des données, on attend des professionnels de l’IT qu’ils proposent ces données à leurs clients ultra-rapidement, tout en les protégeant et ce, sans faire bondir les coûts. Le stockage bloc traditionnel ne parvient plus à suivre le rythme, et le stockage dans le Cloud public peut poser des problèmes de sécurité. Le stockage flash sur site est certes rapide, mais il est cher. 

Comment faire pour optimiser le coût du stockage des données les plus anciennes ?

Concernant la volumétrie du stockage : au début du millénaire, une base de données conséquente pouvait accueillir 100 gigaoctets de stockage, et l’idée de devoir gérer un téraoctet de données relevait de la science-fiction. Aujourd’hui, un seul scan complet du corps humain représente un fichier de 40 Go de données. Multipliez ce chiffre par quelques milliers de patients, puis par quelques années, et vous voilà en route vers des zettaoctets de données. Les baies de stockage bloc, et même les systèmes de fichiers, n’ont tout simplement pas été conçus pour un tel volume.

C’est là que le stockage objet cloud fait son entrée.

Il y a une dizaine d’années, les vendeurs de Cloud à « très grande échelle » (AWS, Azure, Google) développèrent des services de stockage Cloud d’après des modèles à base d’objets afin de répondre aux besoins d’évolutivité, de portée géographique et d’exigences économiques posés par le stockage de données non structurées à grande échelle. Les vendeurs de logiciels de stockage leur emboitèrent rapidement le pas en créant des solutions sur site avec des principes technologiques similaires. Les principales fonctions de ces solutions de stockage objets incluaient :

  • Un espace de nommage non-hiérarchique: pour permettre l’évolutivité au-delà de la structure hiérarchique à répertoires des systèmes de fichiers, en préservant des clés de nommage (identificateurs d’objet) beaucoup plus simples et évolutives, mappées sur des valeurs (les objets, représentant la taille effective de la donnée).
  • Des APIs RESTful : à la place des protocoles de systèmes de fichiers dynamiques (par session) tels que SMB et NFS, le modèle Cloud exige des protocoles sans état de type « requête/réponse », et fonctionne avec le langage et le mécanisme de transport de l’Internet : le HTTP. De la sorte, le stockage objet cloud est efficace à l’échelle de l’Internet, avec des latences plus élevées, et pour des services beaucoup plus distribués que dans le cas des applications historiques (bloc ou fichier).
  • Des métadonnées riches : la capacité de rajouter des « TAG » sur les objets avec des attributs supplémentaires décrivant les données. La valeur et la sémantique des données sont ainsi étendues au-delà des simples attributs retenus dans un système de fichiers (comme, par exemple, la taille du fichier, le propriétaire, ou les permissions).

Et tandis que le stockage objet s’annonçait au départ comme une solution de stockage idéale pour les applications d’archive actives et les données peu souvent utilisées, il couvre aujourd’hui bien plus que ces besoins. De nos jours, les solutions de stockage objet offrent des performances d’évolutivité parfaitement adaptées non seulement à la diffusion de contenus multimédia, mais aussi aux services Cloud en ligne qui doivent répondre à des milliers de requêtes d’accès simultanées, et aux applications d’analyse Big Data. La technologie flash va largement être adoptée par les vendeurs afin d’accroître la performance du stockage objet et d’étendre le type d’applications éligibles.

Pendant de nombreuses années, l’un des freins majeurs à l’acceptation générale du stockage objet cloud était l’absence d’un standard ou à défaut d’API RESTful de référence, à l’instar du NFS et du SMB qui sont devenus les protocoles de fait pour les systèmes de stockage fichier. Plusieurs normes de protocole sont depuis entrées en lice, mais aujourd’hui, la majeure partie des éditeurs de logiciels indépendants (ISV) ont adopté l’API AWS S3 (Simple Storage Service) comme leur API par défaut pour accéder au stockage objet, mais aussi aux solutions de stockage objet sur site. Ceci a largement contribué à simplifier l’adoption du stockage objet cloud par les entreprises.

Implémenter le stockage objet cloud et planifier l’avenir

Lorsque les entreprises songent à revoir leur stratégie de gestion des données, la flexibilité, l’évolutivité, et la facilité de gestion qui caractérisent le stockage objet cloud en font la solution idéale pour la plupart de leurs données non structurées. La première étape consiste à évaluer soigneusement vos besoins en termes de durée de conservation et d’accès aux données, y compris la façon dont le stockage et l’utilisation de vos données peuvent évoluer avec la croissance de votre entreprise et l’émergence de nouvelles exigences. Par exemple, une capacité non négligeable sera requise pour les données IoT.

D’autres aspects à considérer incluent la manière dont vous déployez votre présence dans les différents Clouds, et la façon dont vous gérez les environnements multi-clouds ainsi que votre stratégie Edge.

L’augmentation des Clouds privés et des Clouds publics ainsi que l’émergence de l’informatique Edge du fait de millions d’appareils créant de nouveaux défis pour la gestion des données. Des exaoctets de données seront générés et consommés en Edge, avec des infrastructures cloud locales dédiées, déployées pour répondre aux besoins de vastes communautés d’utilisateurs et d’appareils, tels que les bureaux distants et les succursales, les arènes sportives, les hôpitaux, etc. Un tel déluge de données nécessitera une solution éprouvée capable de stocker, de gérer et d’orchestrer des volumes de données conséquents, aussi bien au cœur de l’infrastructure qu’en Edge.

Au final, on en revient toujours à l’accès aux données : les placer là où leur utilisation sera optimisée, leur accès simplifié pour les utilisateurs autorisés, et leur protection garantie. Les priorités de l’économie des données aujourd’hui sont axées autour de la sécurité, de la mutualisation et de l’agilité des données, ainsi que de la prise en charge des applications cloud native et historiques. Tous ces aspects revêtent une importance égale alors que les entreprises déploient des infrastructures associant des centres de données traditionnels et Edge, des Clouds locaux privés comme AWS Outpost, Azure Stack, et Google GKE, ainsi que le Cloud public. Dans votre quête d’une solution de stockage objet cloud, recherchez un fournisseur qui partage vos priorités et qui pourra collaborer avec vous au fil de l’évolution de votre entreprise.