Amazon dessine les contours d'une plateforme cloud d'IA

Amazon dessine les contours d'une plateforme cloud d'IA Analyse du langage, de la vidéo, création de modèles d'apprentissage… A l'occasion de son événement mondial, AWS a égrainé les annonces de nouveaux services de machine et deep learning.

L'année dernière, lors de l'édition 2016 de son événement mondial re:Invent, AWS avait jeté les bases d'une offre cloud d'intelligence artificielle. Trois services d'IA  étaient alors dévoilés : Amazon Rekognition (pour la reconnaissance d'images),  Amazon Polly (pour la synthèse vocale) et Amazon Lex (pour le pilotage d'interfaces conversationnelles). A cela venait s'ajouter l'infrastructure AMI AWS Deep Learning pour configurer des grappes de serveurs (Amazon EC2, GPU ou CPU) dédiées à l'apprentissage profond ou à l'exécution d'opérations d'inférence de modèles de machine learning. A l'occasion d'AWS re:Invent 2017 qui se tient cette semaine à Las Vegas, le cloud américain a livré toute une série de nouveautés dans l'optique de compléter l'édifice. Des évolutions qui dessinent désormais plus clairement les contours d'une plateforme d'IA.

"Le machine learning et le deep learning sont super stratégiques pour nous"

"Le machine learning et le deep learning sont des domaines super stratégiques pour nous", martèle Andy Jassy, PDG d'AWS.

Côté IA orientée compréhension du langage, AWS introduit notamment une brique de natural language processing (NLP). Baptisée Amazon Comprehend, elle est dessinée pour identifier la teneur d'un texte (positif, négatif ou neutre) et en détecter les phrases clés et entités nommées (lieux, personnalités, marques, produits…). "Elle permet d'améliorer la capacité des bots à saisir les subtilités d'une question. Mais Comprehend pourra également aider à automatiser le traitement de gros volumes de documents, en vue de les classer, les référencer", insiste Andy Jassy.

Dans la même logique, AWS livre Amazon Transcribe : une interface de reconnaissance vocale pour automatiser la retranscription de discours audio (elle est limitée pour l'heure à la prise en charge de l'espagnol et de l'anglais). Mais aussi Amazon Translate pour gérer les traductions (avec à la clés le support de l'allemand, l'arabe, le chinois le français et le portugais). "Amazon Translate peut par exemple servir pour bâtir un chatbot de traduction basé sur Amazon Lex", commente Andy Jassy. Ces deux derniers services sont pour l'instant disponibles en bêta.

Avec SageMaker, AWS propose un studio de datascience qui vient coiffer sa plateforme d'IA. © JDN

Sur le plan du traitement d'images, AWS lance en parallèle un service équivalent à Amazon Rekognition, mais pour la reconnaissance de contenus vidéo (Amazon Rekognition Video). Il est conçu pour identifier les visages ou objets (tels que des produits) apparaissant dans les séquences vidéo. "Il est capable d'ingérer à la fois des vidéos stockées sur Amazon S3 et des flux en streaming, en provenance d'objets connectés dotés d'une caméra par exemple. Pour gérer ce type de processus de streaming vidéo, nous lançons par ailleurs Amazon Kinesis Video Stream", précise-t-on chez AWS.

Fort de l'ensemble de ces nouveautés, Amazon avance désormais une infrastructure d'IA en concurrence de plus en plus frontale avec celles de Google (Google Cloud Machine Learning), IBM (Watson), Microsoft (AI platform) ou Salesforce (Einstein).

Un environnement de datascience

Ce n'est pas tout. Toujours en matière d'IA, AWS a profité de son événement mondial pour commercialiser un environnement de datascience. Le service en question, appelé SageMaker, couvre l'ensemble du cycle de vie d'un modèle d'apprentissage, depuis sa création jusqu'à son déploiement et sa maintenance en passant par "son entrainement". 

Développé en Python tout en étant compatible avec des langages tiers (comme R, C++...), SageMaker est optimisé pour exécuter divers frameworks d'auto-apprentissage (TensorFlow, Apache MXNet, Caffe...) et de nombreux algorithmes (clustering, régression linéaire, réseaux neuronaux...). En sortie, les modèles produits peuvent être déployés sous forme de containers Docker, exactement dans la même logique que ce que propose Azure Machine Learning de Microsoft.

DeepLens : la caméra conçue par AWS pour tester les modèles orientés reconnaissance d'image embarque un processeur Intel Atom X5. © Intel

"SageMaker inclut des mécanises d'A/B testing pour générer et benchmarker les modèles et détecter celui dont les prédictions seront les meilleures", indique Matt Wood, responsable du deep learning chez AWS. Dans ses futures versions, l'outil permettra en outre de faire appel à du machine learning pour aider aux paramétrages des critères de traitement d'algorithmes. 

Pour accompagner SageMaker, AWS annonce en outre la sortie pour début 2018 d'une caméra HD programmable (alias AWS DeepLens) taillée pour tester des modèles de deep learning appliquées à la reconnaissance d'images ou de vidéos. Sous le capot, elle renferme un processeur Intel Atom qui, selon AWS, pourrait atteindre une fréquence de 100 milliards d'opérations par seconde.

Dotée d'une bibliothèque de modèles d'apprentissage préentrainés, "AWS DeepLens permet de développer un projet de deep learning en se basant sur les fonctions serverless Amazon Lambda",  complète Matt Wood. Tarifée 249 dollars, la caméra d'Amazon est disponible en précommande. Sa sortie est prévue au premier semestre 2018.

L'IoT également mis dans la boucle

Toujours à l'occasion de ce re:Invent 2017, plusieurs nouveaux services orientés data ont aussi été présentés par Amazon. "Des services qui, par essence, peuvent servir de fondation en vue de réaliser les analyses à base d'IA", insiste Andy Jassy. Au programme : une offre cloud managée de base de graph (Amazon Neptune), une déclinaison serverless du serveur de données Aurora (Amazon Aurora Serverless), un dispositif de réplication automatique des tables DynamoDB sur plusieurs régions AWS (DynamoDB Global Tables), ou encore une fonction pour requêter (en SQL) des sets d'informations particuliers archivés sur les environnements de stockage Amazon S3 ou Glacier (S3 Select et Glacier Select). "Grâce à ce mécanisme de requêtage, il est désormais concevable de transformer son espace Glacier en data lake", insiste Andy Jassy.

Pour finir, AWS a avancé plusieurs nouveautés en matière d'IoT, parmi lesquelles un OS ciblant les microcontrôleurs (FreeRTOS) ou encore des services de gestion de parc d'objets et de sécurité (AWS IoT Device Management et AWS IoT Device Defender). Avec pour objectif de faciliter l'analyse des flux d'informations produits par les devices, l'une d'entre elles rejoint la problématique de l'intelligence artificielle. Il s'agit d'AWS IoT Analytics. Au-delà de la création de tableaux de bord de pilotage, cette solution a pour but, aussi, de préparer les flux remontés des wearables et autres dispositifs connectés (les nettoyer, les structurer) en vue de leur appliquer ensuite des traitements d'IA.