Les trois nouveaux outils IA qui ont marqué le JDN à Google Cloud Next

Les trois nouveaux outils IA qui ont marqué le JDN à Google Cloud Next A l'occasion de Google Cloud Next, Google a dévoilé une série de nouveautés propulsées par IA. Vertex AI Agent Builder, Google Vids et CodeGemma méritent qu'on s'y attarde.

La conférence annuelle Next de Google Cloud le confirme : l'IA est omniprésente dans le cloud. Nouvelle version de Gemini, nouvelle puce pour l'inférence de modèle… Google Cloud a présenté ce mardi 9 avril une série de nouveaux produits IA pour ses services Cloud. Pour l'occasion, le JDN - qui s'est rendu sur place - retient trois nouveaux produits majeurs qui devraient rapidement être adoptés par les entreprises.

Vertex AI Agent Builder : pour créer son agent d'IA personnalisé

C'est une nouveauté attendue de longue date. Google Cloud présente Vertex AI Agent Builder, son interface permettant de configurer rapidement son propre assistant d'IA.  L'outil est principalement dédié aux développeurs qui souhaitent déployer plus facilement un agent d'IA. Vertex AI Agent Builder est une véritable suite d'outils optimisés pour construire l'assistant personnalisé le plus efficace, adapté aux cas d'usage des entreprises. Selon les premières démonstrations auxquelles nous avons pu assister, bien que simple d'utilisation l'interface offre de nombreuses fonctionnalités avancées.

Vertex AI Agent Builder permet de créer son agent en no-code. Le copilot peut ensuite être directement implémenté dans un framework open source (comme LlangChain). Le RAG est supporté nativement tout comme la recherche vectorielle. Pour des objectifs plus complexes, il est possible également de relier plusieurs agents entre eux. Vertex AI Agent Builder supporte une variété d'API permettant de connecter très facilement les données d'entreprise au bot. L'outil est parfaitement intégré avec Vertex AI Studio et permet d'utiliser un des nombreux LLM proposés par Google Cloud. Le tout s'intègre parfaitement aux normes de sécurité en vigueur dans l'entreprise. En bref, Vertex AI Agent Builder est parfaitement intégré dans l'environnement Google Cloud. Une modularité sans limite qui permet d'avancer rapidement dans la création de son agent IA.

© Google

Plus encore, Vertex AI Agent Builder fonctionne avec des modèles multimodaux complets. En clair, il est possible de donner l'ouïe et la parole à son assistant. "Vous pouvez utiliser Gemini Pro pour créer des conversations fluides et naturelles avec du texte, de la voix, des images et de la vidéo en entrée, et les personnaliser avec des modèles de voix personnalisés", illustre très simplement Thomas Kurian, CEO de Google Cloud.

Google Vids : la création de vidéo simplifiée par IA

C'est une petite révolution pour Workspace. La suite d'applications Google s'enrichit d'un nouveau venu : Google Vids. "Aux côtés de Google Docs, Sheets, Slides, Google Vids est une application de création de vidéos alimentée par l'IA pour le travail. Avec Gemini et Vids, vous disposez d'un assistant de rédaction, de production et de montage vidéo, le tout en un", résume Aparna Pappu, directrice générale de Google Workspace. Google Vids est présenté par Google comme l'équivalent de Google Doc pour la vidéo. L'application doit simplifier de A à Z la création de vidéo : de l'écriture du script, à la production, au montage, Google Vids gère le processus complet.

Propulsé par l'IA, il peut générer un storyboard (modifiable à la main), suggérer des scènes, des fonds sonores… L'outil agit également comme un véritable conseiller et peut aider l'utilisateur dans la construction précise de son storytelling.

Comme l'ensemble des outils Workspace, Google Vids est collaboratif. Il est possible de partager son projet avec d'autres utilisateurs pour travailler à plusieurs. L'interface est fluide et les commandes peuvent également se gérer en promptant le chatbot qui agira en conséquence. Enfin, Google Vids intègre des outils d'IA robustes déjà éprouvés par le passé (transcription, traduction…). Pour le moment seul un petit groupe d'utilisateurs sélectionnés par Google peut tester le produit. Google Vids devrait être déployé plus largement en juin 2024 au sein de Workspace Labs.

CodeGemma : un LLM open source pour la génération de code en local

C'est une variante du désormais célèbre modèle open source de Google qui va ravir les développeurs. CodeGemma est "un modèle open source léger et affiné, conçu pour le codage à partir de la même technologie utilisée pour créer Gemini", détaille le CEO de Google Cloud. De manière assez classique, CodeGemma est capable de générer du code, de faire de la completion (prédiction de code) et plus généralement de le comprendre. Sa spécificité réside davantage dans sa taille. Deux versions sont proposées : en 2 milliards de paramètres ou en 7 milliards. 7 milliards, c'est assez grand pour gérer du code complexe et 2 milliards, c'est assez petit pour être inféré en local, sur une machine avec des ressources limitées (un PC).

CodeGemma meilleur que les modèles open sources de référence. © Google

Le modèle a été entraîné sur plus de 500 milliards de tokens de code, de documents techniques en anglais ou de mathématiques. CodeGemma supporte nativement les langages de programmation les plus populaires (Python, JavaScript, Java…). Pour un langage moins connu (peu présent dans les données d'entraînement donc), il est possible de le fine-tuner pour améliorer ses performances. CodeGemma a été conçu par les équipes de Google pour être facilement implémenté dans un environnement de développement. Nativement, le modèle surpasse plusieurs références open sources comme StarCoder2,  DeepSeek Code ou encore Code Llama sur plusieurs benchmarks. Pour une utilisation plus poussée, pour générer le code d'un projet complet par exemple, CodeGemma peut être intégré dans un système d'orchestration plus complexe.