AWS Re:Invent : Amazon redessine sa plateforme d'IA

AWS Re:Invent : Amazon redessine sa plateforme d'IA Le groupe de Seattle revoit profondément le design de SageMaker Studio et complète son offre de machine learning de nombreuses nouveautés, de la data préparation à la gouvernance en passant par le traitement de données géospatiales.

"Des dizaines de milliers de clients s'appuient sur les modèles de machine learning de SageMaker pour réaliser pas moins de mille milliards de prédiction par mois. Notre plateforme leur permet de résoudre des problèmes complexes, allant de l'optimisation d'itinéraires à la découverte de médicaments", se félicite Swami Sivasubramanian, vice-président base de données, analytics et ML chez AWS. Face à cette utilisation massive, pas étonnant que le cloud de Seattle ait décidé de multiplier les annonces autour de son offre SageMaker à l'occasion de son événement mondial AWS Re:Invent, qui se tient du 18 novembre au 2 décembre à Las Vegas.

Parmi les évolutions les plus visibles, AWS a entièrement redessiné l'interface graphique de SageMaker Studio. Nettement plus dépouillé, l'environnement de machine learning intègre un menu regroupant les principaux processus et composants de la plateforme d'IA d'Amazon : data, AutoML, pipelines, modèles, déploiement... Pour ne citer que lui, l'onglet "Donnée" regroupe la solution de data préparation d'AWS, Data Wrangler, aux côtés de SageMaker Feature Store, centré sur la gestion des caractéristiques des modèles, et d'Amazon EMR qui exécute les phase d'apprentissage.

Intégrer des données de Salesforce ou SAP

Sur la page d'accueil du studio, divers outils sont là pour lancer rapidement un projet. Que ce soit pour importer et formater les data set, lancer un notebook de démarrage, accéder à des modèles pré-entraînés, faciliter le partage des éléments au sein d'une équipe ou encore réaliser du shadow testing en vue d'améliorer la performance des IA en production.

Le design de SageMaker Studio at été revu. © JDN / Capture

Bien conscient que la data préparation joue un rôle clé dans la réussite des projets d'IA, Amazon annonce plusieurs nouveautés concernant la brique centrée sur ce processus, à savoir SageMaker Data Wrangler. Cette dernière permet désormais de puiser des données d'entrainement au sein d'une quarantaine d'applications SaaS parmi lesquelles Salesforce, SAP ou Amplitude. Autre évolution, Data Wrangler s'étend à la prise en charge de l'inférence en temps réel ou en mode batch, notamment en vue de ré-entraîner à la volée des modèles déjà mis e œuvre sur le terrain.

En parallèle, AWS équipe SageMaker d'un environnement de traitement des données géospatiales. Il combine fonctions de transformation ad hoc et modèles pré-entrainés. "Il peut répondre à de multiples cas d'usage, depuis l'analyse des dommages causés par les catastrophes naturelles dans l'assurance jusqu'à la prédiction des rendements des récoltes dans l'agriculture", explique Channy Yun, principal developer advocate chez AWS.

SageMaker intègre un outil d'ingestion de données géospatiales. © JDN / Capture

Enfin, Amazon complète SageMaker de trois outils de gouvernance. Le premier n'est autre qu'un moteur de gestion des rôles. Baptisé SageMaker Role Manager, il gère de façon classique les autorisations d'accès et de modifications en fonction du profil : data scientist, data engineer... Baptisé Amazon SageMaker Model Cards, le deuxième est orienté gestion de contenu. Son objectif : faciliter la création et la maintenance de la documentation des modèles tout au long de leur cycle de vie.

Unifier le monitoring

Troisième et dernière solution, Amazon SageMaker Model Dashboard fédère dans une console unique l'ensemble des indicateurs centrés sur le monitoring des modèles. Elle s'intègre à SageMaker Model Monitor et SageMaker Clarify. "De quoi parvenir à créer des IA de qualité", conclut Antje Barth, principal developer advocate pour l'IA et le ML chez AWS

Autres annonces réalisées lors d'AWS Re:Invent 2022 J-3