OVHcloud AI Solutions : à quoi ressemble la plateforme d'IA du Français ?

OVHcloud AI Solutions : à quoi ressemble la plateforme d'IA du Français ? Marketplace de modèles, training-as-a-Service, serveurs bare metal optimisés... Le fournisseur cloud français lève le voile sur son offre d'intelligence artificielle.

A l'occasion de son événement clients Ecosystem Experience organisé en ligne du 3 au 5 novembre 2020, OVHCloud dévoile sa plateforme d'IA. Baptisée officiellement OVHcloud AI Solutions (nom de code : AI Hub), elle s'articule autour d'une marketplace de modèles et applications de machine learning (ML) prêts à l'emploi. Dans la droite ligne de la stratégie d'écosystème amorcée en 2019 par le groupe français, cette place de marché accueillera les solutions d'éditeurs tiers. OVHCloud précise avoir déjà sélectionné 30 experts européens de l'IA pour participer à cette initiative. Les briques de ML qui y seront propulsées ? Des modèles les plus simples (régression linéaire, logistique, foret aléatoire...) jusqu'aux plus pointus, "par exemple dans l'imagerie médicale, le natural language processing ou encore l'optimisation des transports ou de l'énergie", égraine-t-on chez OVHCloud. Des outils et studios de data science, y compris verticaux, seront également de la partie. Parmi eux figureront les environnements du français Dataiku et du franco-américain Hugging Face. Le tout sera finement intégré à la plateforme. AI Hub dont le lancement est prévu en décembre 2020 tirera profit des certifications et normes de qualité d'OVHCloud.  

En amont, l'AI Hub gère la phase d'apprentissage des modèles via l'environnement OVHcloud AI Training. Qualifié de Training-as-a-Service, il permettra aux data scientists de charger leur projet, via leur notebook Jupyter, puis de partitionner leurs données d'apprentissage et de provisionner à la demande les ressources de calcul graphique (GPU) nécessaires à l'entrainement des algorithmes. OVHCloud automatise le provisioning de l'infrastructure et des clusters de calcul sous-jacents. Un processus qui pourra être parallélisé pour optimiser les temps d'exécution, mais aussi monitorer de bout en bout par le biais d'un outil de supervision développé par OVHCloud. En coulisses, des cartes GPU Nvidia V100 sont là pour réaliser les traitements.

Le framework d'apprentissage s'adosse à de tout nouveaux serveurs haut de gamme assemblés par OVHCloud. Des machines dont bénéficie déjà le cloud privé du fournisseur (via la gamme Hosted Private Cloud Premier lancée en juillet dernier). "Début 2021, elles seront directement commercialisées aux clients sous forme de serveurs bare metal sous les marques Scale et High-Grade", confie au JDN Alain Fiocco, directeur technique d'OVHCloud.

La plateforme d'IA d'OVHCloud associera une place de marché de modèles métiers pré packagés à des studios de data science verticaux combinés à un pipeline pour exécuter les jobs d'apprentissage. Certaines briques existaient déjà telles ML Serving pour gérer le déploiement des modèles ou encore Auto ML pour automatiser leur création. © OVH

En ligne de mire, le cloud français entend proposer de nouveaux serveurs bare metal de grandes capacités SSD, nettement plus performants que les précédents. Garantissant 99,99% de taux de disponibilité, ils seront disponibles à la fois avec des processeurs AMD et Intel. "Cette nouvelle gamme répond aux besoins croissants de nos clients et partenaires en matière de capacités de calcul et de stockage. Elle fait notamment suite à une série de discussions que nous avons eues avec des grands groupes pendant l'été sur des besoins en infrastructures de traitement de données performantes, résilientes et scalables", précise Alain Fiocco. Les configurations ciblées : l'IA, on l'a déjà dit, mais aussi le software-defined storage (SDS), l'hyper converged infrastructure (HCI), la virtual desktop infrastructure (VDI), le high performance computing (HPC), ainsi que le cloud gaming.

Un réseau refondu pour le learning intensif

"Dans la même logique, nous déployons depuis juin dernier sur nos centres de données des network fabrics avec chacune de 100 à 400 Gb de capacité. Entièrement redondées, elles permettent d'ajouter horizontalement des plans de commutation évitant les blocages, avec la possibilité de relier n'importe quel serveur à un autre, pour peu qu'ils soient basés sur un même campus. Du coup à partir du moment où vous êtes installés sur l'un de nos 7 centres de données de Roubaix (et bientôt 8, ndlr), c'est comme si vous étiez connecté de manière adjacente. Avec à la clé une liaison minimale de 4 x 25 Gb pour les serveurs de calcul, avec a minima 10 à 20 Gb respectivement garantis sur notre cloud public et notre cloud privé, et jusqu'à 4 x 50 Gb pour chaque serveur de stockage", détaille Alain Fiocco. "Nous utilisons des disques de 14 ou 15 To. Ce qui nécessite de facto une bande passante importante entre le serveur et la fabric pour optimiser les performances des calculs distribués en cluster."

Les principaux cas d'usage (avec leurs technologies associées) qui ont permis de définir la feuille de route d'OVHCloud dans la data et l'IA. A l'occasion d'Ecosystem Experience, ils sont présentés par Alain Fiocco, CTO d'OVHCloud. © OVHCloud

En vue d'accompagner sa stratégie d'IA, OVHCloud planche sur un renforcement de son offre de cloud public dans la data. Sur ce plan, il prévoit la sortie en bêta pour décembre d'un service de stockage objet de haute performance qui tirera d'ailleurs partie de ses nouveaux serveurs bare metal et de sa nouvelle infrastructure réseau. La commercialisation sera prévue au printemps. "OVHCloud High Performance Object Storage sera proposé dans nos data centers de Roubaix et de Strasbourg. Sachant que l'objectif est de le déployer à terme sur l'ensemble de nos régions cloud", révèle Alain Fiocco. Une nouvelle offre qui repose sur la technologie issue du rachat d'Open IO en juillet 2020. Compatible avec Amazon S3, la pile logicielle de ce dernier permet de scaler de 1 Tb à plusieurs Exabytes de stockage. 

OVHCloud est équipé de 31 data centers à travers le monde. © OVHCloud

Toujours en matière de cloud public, OVHCloud entend suivre la même logique sur le front du stockage en blocs. Une stratégie qui se traduira par le lancement en avril 2020 d'OVHCloud Storage Blocs. Ce service s'adossera directement à la solution logicielle de stockage en blocs (hardware agnostic) de la société Exten Technologies acquise en août dernier.

"OVHCloud Storage Blocs est NVMe (pour non-volatile memory express, ndlr) et surtout 'power by network fabric'. D'où l'intérêt d'une l'infrastructure de network fabric non-bloquante (décrite plus haut, ndlr) qui permettra de bâtir sur notre cloud public un stockage en blocs de haute performance" explique Alain Fiocco.

Vers de nouvelles acquisitions

La nouvelle infrastructure réseau à base de network fabric va s'étendre à l'ensemble de l'offre cloud d'OVHCloud en suivant de manière synchronisée le déploiement des nouveaux serveurs bare metal. Du coup, Hosted Private Cloud est la première brique à en être dotée. Ensuite viendront l'AI Hub, ainsi que la gamme bare metal en tant que telle début 2021. Des serveurs machines qui pourront par exemple s'adosser à l'architecture de network fabric pour réaliser de l'apprentissage intensif distribué. "Cette gamme bare metal s'accompagnera de clusters pré-paramétrés équipée de logiciels préinstallés avec licence intégrée, en vue de répondre à différents cas d'usage", ajoute Alain Fiocco. "Nous commencerons avec la solution hyperconvergée de Nutanix. D'ici quelques mois, nous proposerons des clusters avec des volumes de stockage NetApp. Et ce, à la fois en mode bare metal, mais aussi au sein de notre offre Hosted Private Cloud."

Ensuite, les network fabrics gagneront le cloud public du provider. Quant à la génération 2021 des instances de ce dernier, elles bénéficieront également des nouveaux serveurs bare metal. Enfin, d'ici la fin du premier semestre 2021, OVHCloud anticipe la sortie d'un service de base NoSQL managé, reposant sur le serveur de données MongoDB, mais aussi des nouveautés autour des infrastructures Kubernetes orchestrées. Pour mener à bien ces projets de développement, la société envisage de réaliser de nouvelles acquisitions (voir le tweet ci-dessous publié par Octave Klaba quelques jours avant de l'événement Ecosystem Experience).

OVHCloud en chiffres

  • 2 400 salariés dans le monde (250 recrutements depuis le début de l'année),
  • 3 000 partenaires (voir la capture ci-dessous),
  • 1,6 million de clients dans 140 pays,
  • 7,9 millions de sites web hébergés,
  • 400 000 serveurs,
  • 31 data centers (de nouveaux data enters certifiés Secnumcloud seront prochainement ouverts à Roubaix et Strasbourg dans l'optique de ciblés le secteur public, une nouvelle région cloud installée sur les infrastructures de T-System est en projet en Allemagne à destination des entreprises locales),
  • 48 points de présence réseau,
  • 1,1 million de serveurs (fabriqués en interne).
OVHCloud compte pas moins de 3 000 partenaires qui se répartissent entre différents programmes. Ici, l'écosystème est présenté par Michel Paulin, directeur général du groupe, lors de la conférence de presse d'Ecosystem Experience. © OVHCloud