Repenser le stockage : le défi du secteur de l’Intelligence artificielle

La révolution de l’intelligence artificielle fait apparaître de nouveaux défis technologiques, notamment en matière de stockage.

L’IA, mue par des machines et des services intelligents, soutient depuis plusieurs années la quatrième révolution industrielle; elle fait apparaître de nouveaux secteurs d'activité tout en en rendant d’autres obsolètes.

A l’origine de l’intelligence artificielle

Tous les secteurs d'activité ont à gagner de l’intelligence artificielle : savoir transformer les données brutes en intelligence représente la nouvelle monnaie d’échange face à la concurrence moderne. De nombreux projets illustrent cette tendance: en santé, Google mène actuellement un essai clinique en Inde pour automatiser, via l’IA, le dépistage des rétinopathies diabétiques. Dans le secteur de la consommation, Amazon a annoncé le lancement d’une épicerie conceptuelle sans caisse, Amazon Go, qui emploie les mêmes technologies que les voitures automatiques, avec la fusion des données sensorielles et l'IA.

L'IA s’appuie sur l'alliance de trois technologies clés: le deep learning, les unités de traitement graphique (GPU) et le big data. Le premier est un nouveau modèle informatique qui utilise des couches cachées de réseaux de neurones artificiels inspirés du cerveau humain, et qui peut créer un logiciel simplement en tirant des enseignements d’une multitude d’exemples. Un processeur GPU exécute des algorithmes complexes similaires à ceux du cerveau humain. Ces deux technologies sont venues bouleverser les approches traditionnelles.

L’intelligence artificielle, indissociable du big data

Le big data, troisième pilier de l’IA, est vraiment là: en deux ans, la quantité de calculs requise par les algorithmes du deep learning a été multipliée par 15, et la puissance de calcul des GPU par 10. Malgré l’explosion du volume des données non-structurées, l'innovation sur le stockage semble avoir cessé il y déjà longtemps. Les technologies de stockage ont en effet été conçues pour l'ère, aujourd'hui révolue, du traitement en série, qui ne correspond pas à celui requis par le machine learning par exemple. En outre, le fossé entre les capacités de calcul et de stockage ne cesse de s'élargir.

Si les données sont la monnaie d’échange de la quatrième révolution industrielle, il est déconcertant de penser que le système qui est chargé de les gérer repose sur des composants vieux de plusieurs dizaines d'années. Si le système de stockage est lent, il freine les performances du machine learning, d’où la nécessité d’innover et de concevoir une nouvelle plateforme de données conçue pour l'ère moderne des outils d'analyse intelligents.

Un système de stockage moderne est indispensable

Plus un modèle de deep learning est alimenté en données, plus il gagne en potentiel d’intelligence, si la capacité de l’ordinateur le lui permet. Les utilisateurs qui se lancent dans la voie de l'IA optent souvent pour un ordinateur unique et puissant qui permet de stocker localement toutes les données sur un système à connexion directe équipé de SSD. Cette configuration répond aux besoins des expériences de deep learning testant différentes structures et différents réseaux. Pour Andrew Ng, professeur à l'Université de Stanford, expert dans le domaine de l'IA, le deep learning est différent des autres algorithmes: sa précision et ses performances augmentent avec le volume des données d'apprentissage.

Un modèle qui apprend sur une base de données de 100To est donc beaucoup plus précis qu'un modèle ne disposant que de 1To. D’où la nécessité d’une nouvelle génération de systèmes de stockage pour offrir la bande passante nécessaire aux GPU, pour accéder aux schémas d'accès aléatoires des fichiers, les plus petits comme les plus gros.

Si le principal frein à l’intelligence artificielle auparavant était la puissance de calcul, la nouvelle frontière réside aujourd’hui dans le stockage. Heureusement des solutions apparaissent pour résoudre cette problématique, mais il est important pour les entreprises d’en être conscientes pour ne pas faire le mauvais choix en termes d’infrastructure pour supporter de tels projets.

Annonces Google