L'IA chez AWS : trois services pour trois rôles bien distincts

L'IA chez AWS : trois services pour trois rôles bien distincts Bedrock, PartyRock, SageMaker : Amazon Web Services décline son offre d'intelligence artificielle en plusieurs services, avec chacun un rôle bien particulier. Le point.

L'offre d'Amazon Web Services en matière d'IA est multiforme. Bedrock, PartyRock, SageMaker... L'hyperscaler propose plusieurs services sur ce terrain. Sans compter les multiples instances qu'ils commercialisent pour entraîner ou inférer des modèles de machine learning ou d'IA générative.

Sagemaker, pour créer des modèles de ML

Sorti dès 2017, SageMaker a été le premier service lancé par AWS dans l'intelligence artificielle. Il s'agit d'un service managé conçu pour créer des modèles de machine learning à grande échelle. Il s'articule autour d'un environnement de développement. Baptisé Amazon SageMaker Studio, ce dernier fournit une interface visuelle donnant accès à tous les outils nécessaires à la mise en œuvre d'un modèle, de la préparation de données brutes jusqu'au déploiement en passant par le développement par le biais d'un assistant de codage mais aussi l'entraînement via un outil de débogage.

Ciblant les data scientist, SageMaker permet de charger les données de learning, créer des blocs-notes, entraîner et affiner les modèles, passer d'une étape à l'autre pour ajuster les expériences et, enfin, déployer le produit fini en production. Orienté MLOps, ce service intègre par ailleurs un model store, ainsi qu'un feature store pour gérer les caractéristiques des modèles. Il est également conçu pour mettre au point des modèles de fondation utilisables dans le cadre de l'IA générative.

Bedrock, pour utiliser les modèles

Lancé en septembre 2023, Bedrock n'est pas conçu, lui, pour créer des modèles, mais pour les utiliser et les déployer en production. Pour ce faire, il prend en charge divers modèles de fondation, parmi lesquels Anthropic Claude, Cohere Command & Embed, AI21 Labs Jurassic, Meta Llama, Mistral AI, Stable Diffusion XL, sans oublier Amazon Titan. A partir de cette matière, Bedrock est dessiné pour développer des applications d'IA générative.

Bedrock s'articule autour d'une API unique permettant d'accéder aux modèles de fondation supportés, voire de les combiner. Principal avantage ? Cette interface applicative donne accès aux dernières versions des modèles sans avoir à faire de changement majeur dans le code source de l'application. L'outil permet par ailleurs de fine tuner les modèles, voire de les pré-entraîner en continue sur des sujets spécifiques en vue de cibler un domaine particulier. "Par exemple, vous pouvez entraîner un modèle avec des données privées, telles que des documents d'entreprise, qui ne sont pas accessibles publiquement", précise-t-on chez AWS.

"Amazon Bedrock Studio est dessiné pour prototyper des applications d'IA générative"

A l'instar de SageMaker, Bedrock est désormais équipé d'un environnement de développement visuel. "Baptisé Amazon Bedrock Studio, cette brique, actuellement en préversion, est dessinée pour prototyper des applications d'IA générative. Elle permet également de collaborer à plusieurs autour d'un projet", indique Amazon.

SageMaker comme Bedrock sont facturés en fonction du temps et du type d'instance exécutée en toile de fond. Pour l'entrainement de modèles de fondation, AWS fournit les instances P5 qui repose sur des GPU Nvidia H100. Tarifées 113 dollars par heure, elles seront notamment adaptées à la mise au point des large language models. Ensuite viennent les instances G5 basées sur des cartes graphiques Nvidia A10G Tensor Core. Loin d'être aussi puissantes que les H100, elles conviendront néanmoins à l'entrainement de réseau de neurones profonds nécessitant une certaine performance.

En parallèle viennent des instances adossées à des puces graphiques conçues par Amazon. D'abord les Trn1 qui recourent au processeur AWS Trainium. Ensuite les Inf2 utilisant les puces AWS Inferentia2. Les premières seront mises en œuvre dans le traitement du langage naturel, la vision par ordinateur et la recherche, ainsi que la recommandation et le classement. Le seconde dans la génération et le résumé d'images et de textes, ainsi que pour la reconnaissance vocale. Le principal avantage de ces instances ? Leur rapport performance / prix.

PartyRock, pour créer des assistants intelligents sans code

Aux côtés de SageMaker et BedRock figure PartyRock. Il s'agit d'un service de développement sans code permettant de créer des assistants intelligents en quelques clics. Nul besoin de savoir coder pour l'utiliser. Il permet de concevoir des bots assistant les utilisateurs dans nombre de domaine : rédaction d'une lettre de candidature à partir d'une annonce d'emploi, génération de recettes de cuisines en partant d'une liste d'ingrédients, support technique pour Salesforce... Evidemment, il faudra que le thématique retenu soit suffisamment généraliste pour que le bot fonctionne. Mais le potentiel de PartyRock n'en reste pas moins important.

Cet édifice promet d'être encore complété à l'occasion de l'événement mondial d'Amazon Web Services, qui se tient du 2 au 6 décembre prochain à Las Vegas.