Avec Agent Bricks, Databricks industrialise la création d'agents d'IA
À l'occasion de son Data + AI Summit qui se tient les 11 et 12 juin, Databricks se lance dans l'agentique avec un nouvel outil baptisé Agent Bricks. Cette solution s'inscrit dans la continuité de la plateforme de data intelligence. Elle a pour but de simplifier la création d'agents d'IA conçus à partir des données internes des clients du Californien. Elle propose une démarche intégrée qui évite aux équipes de devoir combiner manuellement différents outils.
Agent Bricks automatise le cycle de conception des agents d'IA. L'utilisateur commence par définir en quelques mots la mission ou le rôle que l'agent doit remplir. Il connecte ensuite les sources de données souhaitées. À partir de là, l'ensemble du processus est géré par la plateforme : création de benchmarks adaptés, sélection du modèle optimal et mise en place des techniques de récupération d'information (RAG)... Le but affiché est de livrer un agent prêt à l'emploi, équilibré en termes de coût et de performance, sans nécessiter de longs ajustements manuels.
Databricks cherche ainsi à industrialiser les étapes du cycle de développement des agents. "Avec Agent Bricks, vous passez d'un format brut assez vague à des données structurées en JSON exploitable par ce type d'application", explique Naveen Rao, vice-président IA chez Databricks. L'approche retenue par Agent Bricks repose notamment sur la génération de données synthétiques. Ces informations virtuelles sont construites à partir des spécificités de l'entreprise, de manière à nourrir les modèles sans exposer les données réelles de la société. Cette phase permet de simuler des cas d'usage représentatifs et de tester les capacités de l'agent dans un cadre contrôlé.
Un moteur d'évaluation
En parallèle, des modèles spécialisés dans l'évaluation sont utilisés pour noter la pertinence des réponses en fonction du contexte métier. "C'est le cœur du réacteur. Nous observons toutes les questions posées. À partir de là, nous utilisons un gradient du type : '1% du temps vous obtenez la bonne réponse, nous voulons que le système donne la bonne réponse 99% du temps'. Nous recourons ensuite à l'apprentissage par renforcement pour optimiser les résultats. C'est une partie de notre sauce secrète. Au final, vous n'avez pas besoin de données étiquetées", confie Naveen Rao.
"Il est nécessaire d'éliminer les hallucinations et les inexactitudes pour rendre l'agent utile"
"Presque tous les projets de RAG ont échoué parce que les données utilisées n'étaient pas assez précises. Le plus gros problème aujourd'hui pour ces systèmes d'IA générative réside donc dans la précision. Il est nécessaire d'éliminer les hallucinations et les inexactitudes pour les rendre exploitable", ajoute Naveen Rao.
L'optimisation ne s'arrête pas à l'entraînement. Agent Bricks explore un ensemble de configurations possibles : choix du modèle de langage, méthode de récupération des informations, pipeline de traitement, logique de supervision... L'objectif est d'identifier automatiquement l'itération qui répond au mieux à la problématique posée, qu'il s'agisse de rapidité, de précision, ou de coût d'exécution. L'entreprise utilisatrice peut ainsi sélectionner l'agent le plus adapté à ses priorités opérationnelles.
La solution se veut applicable à différents cas d'usage dans des secteurs variés. Dans le domaine de la distribution, par exemple, elle pourra extraire des informations structurées à partir de documents commerciaux comme des catalogues fournisseurs, en convertissant des fichiers PDF ou des e-mails en champs exploitables. Dans le secteur industriel, elle fournira un accès direct à la documentation technique à travers des assistants contextuels, capables de répondre de façon fiable à partir des procédures internes ou des manuels de maintenance. Dans le domaine de la santé, Agent Bricks permettra de transformer du texte clinique brut — comme des notes médicales ou des résultats en laboratoire — en résumés adaptés aux agents médicaux. Enfin, les institutions financières pourront faire appel aux agent pilotés par Agent Bricks pour les vérifications de conformité.
Principale valeur ajoutée annoncée ? La possibilité de créer des systèmes multi-agents, un usage encore peu démocratisé. Pour ce faire, Agent Bricks propose une couche de supervision capable de piloter plusieurs agents coopérant sur des tâches distinctes, par exemple pour enchaîner extraction de données, génération de réponses et contrôle réglementaire. Cette orchestration peut inclure des éléments issus de l'assistant conversationnel Genie de Databricks, d'autres agents LLM externes ou des outils métiers existants.
La société de San Francisco, qui a historiquement bâti sa réputation sur sa plateforme d'analyse de données unifiée, poursuit ici une diversification stratégique vers l'IA appliquée. L'entreprise revendique plus de 10 000 clients dans le monde, dont une majorité d'acteurs du Fortune 500. Elle s'appuie sur des technologies maison comme Apache Spark, Delta Lake ou Unity Catalog, et revendique une expertise éprouvée dans la mise en œuvre de l'IA à l'échelle industrielle.
Le changement dans la continuité
L'introduction d'Agent Bricks s'inscrit dans une logique de continuité avec l'orientation adoptée depuis plusieurs années par Databricks : rapprocher les mondes des données et de l'intelligence artificielle en proposant une plateforme unifiée capable de répondre aux exigences de la production. Cette approche semble s'imposer progressivement dans l'industrie, à mesure que les premières expérimentations avec les LLM laissent place à des usages métier concrets. Pour preuve : l'annonce réalisée par Snowflake, qui reste le principal concurrent de Databricks, autour de l'agentique à l'occasion de son propre événement mondial il y a quelques jours (lire l'article Snowflake s'élance dans l'IA agentique avec deux nouveautés).
Reste à observer comment Agent Bricks sera accueilli par les équipes techniques et les directions métiers dont les attentes en matière de fiabilité, de sécurité et de retour sur investissement restent élevées. La phase de bêta qui s'ouvre ce jour servira de test grandeur nature pour valider les promesses avancées. Elle permettra aussi de mesurer la capacité de Databricks à s'imposer comme un acteur de référence dans l'IA générative d'entreprise, un terrain où la compétition s'intensifie avec l'entrée de nouveaux éditeurs et la montée en puissance de solutions open source.
Autres annonces de Databricks dans l'IA réalisées à l'occasion de son Data + AI Summit :
- La prise en charge de GPU en mode serverless,
- Le support de MLflow 3.0.