Comment l'IA permet de faire face à l'explosion du stockage de données

Comment l'IA permet de faire face à l'explosion du stockage de données Gagner en performance, optimiser les coûts, anticiper les pannes… L'IA contribue à automatiser le pilotage des infrastructures de stockage. Pure Storage et HPE se positionnent sur ce créneau.

Décidément, aucun domaine n'échappe au mouvement de l'intelligence artificielle. Le monde du stockage informatique pas plus qu'un autre. Les acteurs de ce marché commencent en effet à comprendre tout l'intérêt qu'ils peuvent avoir à s'appuyer sur le machine learning. L'IA peut leur permettre d'anticiper des défaillances au sein de leur système tout en gagnant en performance. Un certain nombre de tâches, réalisées aujourd'hui manuellement, sont, par ailleurs, automatisables grâce à l'IA. En fonction du temps d'accès souhaité, des données peuvent être, par exemple, progressivement déplacées, sans intervention humaine, d'un système d'information interne vers des solutions d'archivage "tiède" ou "froid", dans le cloud. Réduisant d'autant le coût de l'hébergement.

Deux équipementiers se positionnent tout particulièrement sur ce créneau : Pure Storage et HPE (depuis le récent rachat de Nimble Storage). Le premier a donné en juin dernier le coup d'envoi de la commercialisation de Meta. Intégré à l'offre Pure1, il s'agit d'un service cloud de monitoring basé sur des mécanismes de machine learning. Il fournit une intelligence prédictive alimentée chaque jour par plus d'un milliard de données télémétriques remontées depuis les milliers de baies installées chez les clients du groupe. Des données qui sont collectées et analysées depuis un data lake de 8 pétabytes. Sur la base de cet historique, Meta peut prédire une panne sur tel ou tel composant avant que celle-ci n'apparaisse.

Des taux de disponibilité de 99,9999%"

"En comparant les équipements les uns aux autres il est possible via Meta de déceler les signes avant-coureurs d'un dysfonctionnement ou d'un problème de performance", indique Gabriel Ferreira, directeur technique de Pure Storage France. "Le mois dernier, l'un de nos clients utilisant l'outil a par exemple reçu une alerte car le taux d'utilisation d'un de ses équipements avait franchi les 60%. Après vérification, il s'est avéré que cette alerte était due à une charge automatique créée par un stagiaire." Selon l'expert, l'IA permet à Pure Storage de tendre vers un taux de disponibilité de 99,9999%, soit quelque 30 secondes d'arrêt de service par an.

Gabriel Ferreira, directeur technique de Pure Storage France. © Pure Storage

L'IA offre aussi une meilleure visibilité sur le niveau de performance d'une infrastructure de stockage. Via des outils de planification des capacités (ou capacity planning), un administrateur peut déjà faire évoluer un espace de stockage en se projetant à six mois ou un an. Avec le load planning désormais rendu possible par l'IA, il procède de même avec la charge de travail. "L'analyse prédictive vous conseillera de déplacer telle charge de travail d'un équipement 1 vers un équipement 2 pour gagner en coûts et en performance", poursuit Gabriel Ferreira. "Ce type d'analyse est très difficile à réaliser pour un humain à moins de tâtonner en procédant manuellement à différents essais."

Si Pure Storage ne fait pour l'heure que proposer telle ou telle allocation de ressources de stockage, elle pourrait, demain, automatiser ce process. "Cette possibilité est à l'étude. Nous attendons d'abord le retour de nos clients avant d'aller plus loin. Mais je pense qu'ils s'apercevront rapidement que chaque conseil préconisé est judicieux et qu'ils n'auraient pas mieux agi", argue le directeur technique de Pure Storage France.

Selon Gabriel Ferreira, l'IA est particulièrement intéressante pour optimiser le stockage au sein de systèmes gérant de grosses volumétries. D'où le partenariat conclu par Pure Storage avec nVidia et le lancement, l'an dernier, de FlashBlade, une plateforme full flash de stockage de données en volume avec un temps d'accès réduit. Parmi les clients de Pure Storage faisant appel à ce type d'architecture, on peut citer Zenuity, une joint-venture de Volvo et Autoliv qui prépare la mise en circulation de véhicules autonomes d'ici à 2021, ou encore Man AHL, une plateforme britannique d'optimisation des passages d'ordres en bourse.

L'automatisation de la gestion d'incident

Sur le front de l'intelligence artificielle appliquée au stockage, le rival le plus sérieux de Pure Storage n'est autre que Hewlett Packard Enterprise (HPE) depuis le rachat  par ce dernier de Nimble Storage pour 1,2 milliard de dollars en mars 2017. Fondé il y a dix ans, Nimble Storage emploie près de 1 300 personnes dans le monde pour un chiffre d'affaires de 402 millions de dollars. Le fournisseur américain a débuté en commercialisant des offres de stockage hybrides (mêlant disques classiques et SSD) pour s'orienter ensuite vers des solutions 100% flash. Il apporte aussi dans sa corbeille InfoSight, un outil d'analyse capable de diagnostiquer et de prévenir des pannes sur les baies de stockage. A terme, InfoSight doit profiter à toute l'offre stockage de HPE qui l'a déjà intégré à 3Par, sa solution de milieu - haut de gamme.

"InfoSight compare les performances de l'infrastructure à celles de clients évoluant dans un environnement similaire"

Pour Christian Laporte, chef de produit stockage chez HPE, le point fort d'InfoSight tient dans sa capacité à donner une vision d'ensemble de l'état de santé d'un système grâce à des capteurs répartis sur toutes les couches et pas seulement sur les baies de stockage. "Le client qui rencontre un problème de performance pourra zoomer sur les différentes parties de son infrastructure pour en trouver la cause. Un problème de latence peut en effet être dû au stockage mais aussi au réseau, au serveur, à la VM ou à l'application. InfoSight va comparer les performances de l'infrastructure à celles de clients évoluant dans un environnement similaire", explique Christian Laporte.

Selon les statistiques compilées par Nimble, seuls 46% des incidents proviennent du stockage. Sur les 54% restants, 28% s'expliqueraient par des problèmes de configuration d'infrastructure, 11% par un manque d'interopérabilité entre composants logiciels, 8% par des règles de bonne pratique non appliquées, et 7% mettent en cause le serveur ou l'hyperviseur.

Nimble Storage, qui revendique, comme Pure Storage, un taux disponibilité de 99,9999% a fait le choix d'une plus grande automatisation que son concurrent. Ses systèmes permettraient de résoudre automatiquement 86% des incidents. Les incidents de niveau 1 ou 2 pourraient ainsi être gérés sans que le client n'ait besoin d'ouvrir de ticket, le support technique de Nimble Storage n'intervenant qu'au support de niveau 3.