Rohit Prasad (Amazon) "Nova est déjà déployé dans de nombreux secteurs d'Amazon"

Rohit Prasad est SVP et head scientist, artificial general intelligence chez Amazon. Il revient pour le JDN sur l'annonce de la nouvelle famille d'IA générative Amazon Nova et sur son intégration future dans les services Amazon.

Rohit Prasad est SVP et head scientist, artificial general gntelligence chez Amazon. © RP

JDN. Vous  lancez une nouvelle famille de modèles d'IA générative appelée Nova. Quel est l'objectif stratégique de ce lancement ?

Rohit Prasad. Ces dernières années, nous avons analysé comment l'IA générative pouvait être intégrée dans chaque secteur d'Amazon, et force est de constater qu'aucun domaine n'échappe à son potentiel. Cette expérience nous a beaucoup appris. Notamment, s'il est relativement facile de créer une démonstration impressionnante, la mise en pratique soulève plusieurs défis : le coût, car ces systèmes consomment énormément de puissance GPU, et la latence - prenez Alexa par exemple, les utilisateurs attendent une réponse quasi instantanée. De plus, ces modèles doivent souvent être personnalisés pour des cas d'utilisation spécifiques, intégrant des données et des systèmes propres à chaque activité. Cela nécessite des capacités comme le RAG et l'interaction avec différentes API, tout en s'intégrant harmonieusement aux systèmes existants.

Après avoir développé près d'un millier d'applications génératives, nous avons identifié des besoins récurrents qui ont guidé la création de nos nouveaux modèles. Notre approche portfolio découle directement de notre philosophie, basée sur l'observation des clients : il n'existe pas de modèle unique capable de répondre à tous les besoins en toutes circonstances. Comme l'a souligné Andy (Jassy, directeur général d'Amazon, ndlr), nous réapprenons constamment que le choix du client est fondamental. Nous l'avons constaté avec les bases de données, les outils de machine learning, l'analytique, et même avec chaque produit sur Amazon.com. C'est pourquoi nous sommes confiants dans nos modèles d'où la publication de tous nos benchmarks démontrant leur état de l'art. 

Votre objectif est-il de vous positionner comme concurrent direct face aux acteurs majeurs du marché de l'IA, tels qu'OpenAI et les autres éditeurs de modèles ?

Je ne dirais pas que nous abordons cela sous l'angle de la concurrence. Notre focus est vraiment centré sur la valeur que nous pouvons apporter aux clients, sur ce qui est pratique et utile pour eux. La concurrence est saine, qu'il s'agisse d'autres entreprises ou même des attentes parfois très élevées véhiculées par les médias - comme l'idée que l'IA pourrait tout résoudre. Quand on y regarde de plus près, on se heurte à des défis concrets, notamment en termes de coûts. Pour nous, ces défis, qu'ils viennent de la concurrence ou du marché en général, sont autant d'opportunités de nous améliorer et d'aller plus loin.

Nova est-il déjà intégré à d'autres solutions de l'écosystème Amazon comme Alexa ?

Nova et sa technologie sous-jacente sont déjà déployés dans de nombreux secteurs, non seulement en interne chez Amazon, mais aussi auprès de partenaires externes. Par exemple, Deloitte va intégrer Nova dans ses solutions pour plusieurs de ses clients. Dans le domaine de la publicité, Nova s'avère particulièrement utile pour la génération de contenus créatifs à partir de sources simples, ce qui représente traditionnellement l'un des défis majeurs du secteur. 

"A l'échelle du groupe, nous utilisons plus de 2 000 modèles différents"

A l'échelle du groupe, nous utilisons plus de 2 000 modèles différents, comme nous l'avons déjà communiqué publiquement. Prenons l'exemple d'Alexa : ce système complexe intègre à la fois des modèles génératifs et non génératifs, comme le modèle waveboard qui fonctionne en permanence pour détecter le mot d'activation. Nova va très certainement jouer un rôle important dans cet écosystème de modèles interconnectés.

Quelles sont les prochaines étapes de développement pour Nova ? Faut-il s'attendre à de nouveaux modèles ? 

Notre prochain grand lancement sera le modèle Premium, prévu pour un à deux mois. Ensuite, nous déploierons notre modèle de reconnaissance vocale (speech-to-speech). Cette évolution est cruciale car les utilisateurs s'attendent désormais à pouvoir interagir de manière conversationnelle avec les systèmes - ce qui a toujours été notre aspiration. Après cela, nous prévoyons de développer des modèles de communication multilingue natifs. Voilà nos principales priorités pour l'avenir proche.

Prévoyez-vous de déployer des mises à jour régulières des modèles ?

Notre calendrier est effectivement très chargé. Nos ambitions dans ce domaine sont immenses, car nous sommes convaincus, que l'IA va tout transformer. Elle porte en elle le potentiel de résoudre certains des plus grands défis de l'humanité. Prenez l'exemple de l'analyse et la synthèse des protéines : les implications pour la médecine, la santé et l'environnement sont considérables.

"Notre vision de l'AGI est celle d'une capacité de niveau expert humain sur un ensemble généralisé de tâches"

Notre effort constant vise à faire progresser ces technologies, car nous considérons que ce domaine est absolument crucial. Alors, y aura-t-il des mises à jour ? Absolument, vous pouvez vous attendre à de nombreuses évolutions.

Travaillez-vous également sur le développement d'une intelligence artificielle générale (AGI) ?

Oui, nous travaillons clairement sur l'AGI, notre équipe s'appelle d'ailleurs "AGI". Notre vision de l'AGI est celle d'une capacité de niveau expert humain sur un ensemble généralisé de tâches. Nous ne pensons pas qu'il y aura un moment précis où l'AGI apparaîtra soudainement. C'est plutôt un processus progressif, et même si cela peut surprendre, nous sommes engagés dans cette évolution depuis une décennie, voire plus. Tous nos développements actuels contribuent à cette direction, et c'est absolument notre objectif.