A l'occasion de Google Cloud Next, Google met le paquet sur Gemini et dévoile de nouvelles fonctionnalités multimodales.

Google continue d'avancer ses pions dans la course à l'intelligence artificielle générative. Ce 9 avril à Las Vegas, à l'occasion de Google Cloud Next, sa conférence annuelle dédiée aux entreprises où le JDN est présent, Google a dévoilé de nouveaux atouts à son modèle phare Gemini. Alors que l'industrie accélère le déploiement en production des outils basés sur l'IA générative, Google souhaite en effet rester à la page en offrant aux entreprises de nouveaux cas d'usage encore peux explorés.

Gemini 1.5 Pro : 1 million de tokens de contexte et le multimodal

Google l'annonce : Gemini 1.5 Pro est progressivement déployé auprès de l'ensemble des clients Google Cloud depuis la plateforme Vertex AI. La principale innovation de Gemini 1.5 Pro réside dans sa capacité à traiter des contextes beaucoup plus larges. Alors que le précédent modèle était limité à 128 000 tokens, Gemini 1.5 Pro peut gérer jusqu'à 1 million de tokens en une seule requête. Concrètement, cela signifie qu'il peut analyser et comprendre des documents beaucoup plus volumineux et complexes : rapports annuels, contrats juridiques, documentation technique, code source... De quoi ouvrir de nombreuses perspectives d'applications pour les entreprises.

Autre atout majeur de Gemini 1.5 Pro : sa capacité à traiter des données multimodales. Au-delà des textes, il peut en effet interpréter des images, des vidéos et des sons. Il devient ainsi possible d'analyser automatiquement le contenu d'une réunion enregistrée, de générer des descriptions détaillées d'images produits, ou encore d'extraire des insights de vidéos corporate. Les data scientists et développeurs pourront ainsi entraîner, ajuster et déployer des applications IA basées sur Gemini 1.5 Pro en quelques clics.

Gemini Code Assist : le couteau suisse du développeur

Parmi les nombreuses déclinaisons de Gemini dévoilées lors de Google Cloud Next '24, Gemini Code Assist est certainement l'une des plus utiles pour les développeurs. Code Assist un est véritable co-pilote IA pour les développeurs, capable de comprendre leur code, de suggérer des améliorations et même de générer automatiquement des tests et de la documentation. Propulsé par Gemini 1.5 Pro, Gemini Code Assist se distingue par son approche multiplateforme (cloud et on-premises), multi-langage (Java, Python, Go...) et même multi-repository (GitHub, GitLab, Bitbucket...). De quoi s'intégrer facilement dans n'importe quel environnement de développement.

Mais la véritable prouesse de Gemini Code Assist réside dans sa compréhension complète du code existant. Grâce à un mécanisme d'indexation et d'analyse sophistiqué, il peut suggérer des modifications à l'échelle de toute la base de code, et pas seulement au niveau d'un fichier isolé. Un atout précieux pour maintenir la cohérence et la qualité des applications à grande échelle. Gemini Code Assist va même plus loin en intégrant des fonctionnalités spécifiques pour le développement d'applications IA. Optimisation de modèles TensorFlow, assistance pour l'utilisation des API IA de Google Cloud... Tout est prévu pour démocratiser l'IA auprès des développeurs, sans sacrifier leur productivité.

Gemini 1.5 intégré directement dans les services Cloud

Google Cloud intègre directement les capacités de Gemini 1.5 Pro dans plusieurs de ses services cloud. BigQuery (data warehouse) et Looker (BI) bénéficient désormais d'une interface conversationnelle en langage naturel pour interagir avec les données. De même, Vertex AI Search exploite Gemini 1.5 Pro pour permettre des recherches sémantiques performantes sur de vastes corpus de documents. Les cas d'usage potentiels sont innombrables et touchent tous les secteurs : chatbots intelligents pour le service client, automatisation du traitement des sinistres en assurance, analyse prédictive des ventes, détection des anomalies dans les processus industriels, rédaction assistée de contrats, etc.

Enfin, les modèles Gemini sont désormais intégrés nativement au sein des principales bases de données de Google Cloud (Spanner, Cloud SQL ou Memorystore). De quoi faciliter l'adoption de l'IA générative au plus près des données opérationnelles. Côté sécurité, les fonctionnalités IA de Chronicle montent en puissance (toujours avec Gemini) pour assister les équipes de sécurité dans les investigations et la détection des menaces.

Plusieurs grands groupes comme Bayer, Orange, Verizon ou Vodafone sont déjà en train d'expérimenter Gemini 1.5 Pro dans le cadre de projets IA pilotes.