Annonce surprise de la conférence re:Invent de AWS, Amazon présente Nova, une nouvelle famille de modèles d'intelligence artificielle de pointe pour la création de texte, d'image et de vidéo.

Amazon accélère encore dans l'IA générative. A l'occasion de re:Invent 2024, la conférence annuelle d'AWS, la maison mère du géant du Cloud a dévoilé une nouvelle famille de frontier models. Amazon Nova, de son nom, rassemble l'ensemble des nouveaux modèles d'IA générative d'Amazon. A la pointe des benchmarks, ces nouveaux modèles sont pensés pour scaler rapidement en maintenant des coûts d'utilisation plus raisonnables pour les entreprises. Micro, Lite, Pro, Premier, Canvas, Reel... Voici l'ensemble des nouveaux modèles annoncés par Andy Jassy, CEO d'Amazon, sur place.

Amazon Nova Micro, Lite, Pro et Premier : un LLM multimodal de pointe

Au cœur de cette nouvelle gamme, Amazon déploie quatre modèles de langage aux capacités croissantes. Le plus léger, Nova Micro, se concentre sur le traitement de texte avec une rapidité d'exécution "record" pour les tâches basiques et un contexte de 128 000 tokens. Plus polyvalent, Nova Lite ajoute la compréhension des images et des vidéos avec une fenêtre de contexte de 300 000 tokens, tout en conservant des coûts compétitifs. Nova Pro se positionne comme le modèle le plus équilibré, disposant également d'un contexte de 300 000 tokens et capable d'analyser aussi bien des documents financiers que du code ou des contenus visuels.

Enfin, AWS annonce un dernier modèle pour début 2025 : Nova Premier, présenté comme le plus sophistiqué de la famille. Il devrait disposer de capacités avancées de raisonnement. Particularité de ces modèles : ils sont tous fine-tunables pour s'adapter aux besoins spécifiques des entreprises et compatibles avec plus de 200 langues, dont le français.

Amazon Nova Canvas : un modèle de génération d'images

Dans la lignée des modèles text-to-image comme DALL-E ou Midjourney, Amazon dévoile Nova Canvas, son modèle de génération d'images présenté comme "state-of-the-art". Il permet de créer des images de qualité professionnelle à partir de texte ou d'autres images. Le modèle inclut également des fonctionnalités avancées d'édition d'image en utilisant un prompt.

Le modèle se distinguerait par ses contrôles précis sur les styles visuels et la mise en page. Contrairement à Micro, Lite, Pro ou Premier, Canvas ne fonctionne pour l'instant qu'en anglais, avec une limite de 1024 caractères par prompt. Amazon promet également des capacités de fine-tuning (disponibles prochainement) et intègre par défaut des contrôles de sécurité, notamment le filigranage automatique des images générées.

Amazon Nova Reel : un modèle de génération vidéo

Dans la continuité de Canvas, AWS complète son arsenal avec Nova Reel, son modèle de génération vidéo. L'ambition est claire : permettre aux entreprises de créer facilement des vidéos de haute qualité à partir de texte et d'images. Sa particularité réside dans le contrôle précis qu'il permettrait sur le style visuel et le rythme des vidéos.

Le modèle permet notamment de gérer les mouvements de caméra. Comme Canvas, Reel se limite pour l'instant aux instructions en anglais (avec une limite de 512 caractères) et intègre des garde-fous notamment le filigranage des contenus générés. Les premières vidéos partagées laissent à penser que le modèle serait aussi bon que Sora d'OpenAI.