Le cloud d'Amazon entre dans l'ère de l'IA no code

AWS équipe sa plateforme d'intelligence artificielle d'une couche graphique visant à mettre le développement de modèles de machine learning entre les mains des data analysts.

Comment faire en sorte que tout décideur métier puisse directement créer et déployer ses modèles de machine learning sans dépendre des data scientists et data engineers ? C'est la problématique à laquelle entend répondre AWS en équipant sa plateforme d'IA, SageMaker, d'un environnement de développement sans code. Le nouveau service a été dévoilé par la branche cloud d'Amazon à l'occasion de Re:Invent 2021, son événement mondial qui se tient à Las Vegas du 28 novembre au 2 décembre. Baptisée SageMaker Canvas, cette surcouche no code permet, à partir d'un ou plusieurs data sets d'apprentissage, de générer un modèle prédictif qui pourra ensuite être réentrainé au fur et à mesure de l'évolution des données.

Des centaines modèles

"SageMaker Canvas s'adosse à la plateforme SageMaker pour nettoyer et combiner automatiquement les sources de données", explique Alex Casalboni, developer advocate chez AWS. "En arrière-plan, il crée des centaines de modèles, compare leurs résultats, sélectionne le plus performant, puis génère la ou les prédictions qui en découlent." Pour les connaisseurs, la solution peut piocher dans plusieurs types de traitement : classification binaire, classification multiclasse, régression ou encore time series forecasting. "Ils permettront de répondre à des cas d'usage divers : détection de fraudes, anticipation de désabonnements, prédiction de stock", égraine Alex Casalboni.

Dans l'e-commerce, SageMaker Canvas pourra par exemple aboutir à un modèle permettant de prédire le taux de livraison en fonction de divers critères : le transporteur utilisé, la distance parcourue, le jour d'expédition... La démonstration de ce cas d'usage est réalisée sur le blog d'AWS. "Nous avons utilisé deux fichiers .csv : l'historique de commandes et le catalogue de produits. Canvas s'est chargé de les fusionner, avant de passer à l'étape d'entrainement puis à l'analyse prédictive", explique Alex Casalboni, avant de préciser : "Il est également possible de puiser des données dans Amazon S3 (le service de stockage orienté objets d'AWS, ndlr) ou dans un système tiers comme Snowflake."

La data préparation nécessaire

Evidemment, les données ingérées par Canvas devront être préalablement formatées. Dans l'exemple évoqué ci-dessus, les colonnes des fichiers .cvs doivent correspondre pour que la démonstration fonctionne aux critères utilisés ensuite pour aboutir au modèle prédictif (à savoir : transporteur, distance, jour d'expédition). Une fois ce travail de data préparation réalisé, Canvas automatise l'ensemble du processus.

En bout de course, un graphique permet d'aller plus loin en visualisant trois indicateurs clés de résultat du modèle : le rappel, la précision et la moyenne harmonique. Des chiffres qui, évidemment, parleront avant tout aux data scientists (lire l'article : Quels KPI pour mesurer la réussite d'un projet d'IA ?).

AWS n'est pas le premier à se positionner sur le terrain du machine learning no code. Parmi les éditeurs présents sur ce segment, on compte notamment C3.ai et DataRobot qui proposent également des plateformes d'IA de bout en bout. Quant à Microsoft et Google, ils commercialisent eux-aussi des approches équivalentes sur leur cloud respectif. Le premier avec son environnement de développement Azure Machine Learning Designer, et le second avec son service de machine learning automatisé Google Cloud AutoML (lire l'article Le machine learning automatisé va-t-il remplacer le data scientist ?).