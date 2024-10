La start-up, spécialisée dans la transcription audio et l'analyse vocale par IA, séduit les investisseurs en série A pour développer son moteur multilingue en temps réel.

La pépite française de l'IA vocale décolle. Fondée en 2022 par Jean-Louis Quéguiner (ancien responsable de l'IA chez OVH) et Jonathan Soto, Gladia a su rapidement se démarquer grâce à sa technologie de pointe de reconnaissance vocale et d'analyse audio. L'entreprise s'impose maintenant comme un acteur incontournable de l'IA française aux côtés de Mistral AI, LightOn ou encore Poolside.

La technologie derrière Gladia

Le cœur de l'innovation de Gladia réside dans son API de transcription et d'intelligence audio, capable de traiter plus de 100 langues avec une précision remarquable. Cette technologie s'appuie sur une version propriétaire et optimisée de Whisper, un modèle open-source développé par OpenAI. La force de Gladia réside dans sa capacité à avoir amélioré et adapté Whisper pour répondre aux besoins spécifiques des entreprises. Baptisé Whisper-Zero, le modèle offre des performances supérieures en termes de vitesse et de précision, notamment pour le traitement en temps réel, un domaine où le modèle original de Whisper montrait certaines limitations.

L'un des aspects les plus innovants de la technologie de Gladia est sa capacité à gérer le "code-switching", c'est-à-dire le passage d'une langue à une autre au sein d'une même conversation. Les performances du moteur de Gladia sont remarquables. Il peut transcrire une heure d'audio en moins de 60 secondes, avec une latence inférieure à 300 millisecondes pour la transcription en temps réel.

A l'avenir, l'entreprise va pousser encore un peu plus les performances de son architecture en modifiant le modèle de décodeur de Whisper. "Nous cherchons un modèle multilingue performant d'environ 1,5 à 2 milliards de paramètres pour remplacer le décodeur actuel basé sur GPT-2. Notre prochain défi sera de fusionner les espaces vectoriels des encodeurs Whisper avec ceux du nouveau modèle de langage choisi. L'objectif est de trouver un équilibre entre performance, coût et vitesse", explique le PDG Jean-Louis Quéguiner.

Une levée stratégique

Cette levée de 16 millions de dollars (environ 14,9 millions d'euros) en série A marque une étape cruciale dans le développement de Gladia. Menée par XAnge, avec la participation d'investisseurs comme Illuminate Financial et XTX Ventures, l'opération va permettre à l'entreprise d'accélérer son développement et de renforcer sa position face aux géants américains du secteur.

Avec ce nouvel apport financier, Gladia se fixe des objectifs ambitieux. L'entreprise compte intensifier ses efforts de R&D pour développer une boîte à outils IA complète pour l'audio. Un autre axe majeur de développement concerne le lancement commercial de sa solution d'assistance aux agents pour les centres d'appels, actuellement en phase pilote. "Nous allons bientôt lancer la partie temps réel, ainsi qu'un assistant utilisant du RAG (Retrieval-Augmented Generation). Nous prévoyons également d'intégrer des connecteurs de téléphonie pour nous développer davantage sur le marché des centres d'appels. Nous pensons que l'assistance par IA permet aux opérateurs d'être plus performants. Nos observations montrent une amélioration de 30% en termes de vitesse et de suivi post-appel. Pour les ventes assistées, nous constatons une augmentation de 50% du taux de conversion et une réduction de 30% des tâches administratives", détaille Jean-Louis Quéguiner.

Enfin, Gladia se prépare à une expansion internationale agressive aux Etats-Unis, notamment via le recrutement de nouveaux talents pour renforcer ses équipes de vente et marketing. Pour autant, la start-up ne compte pas prendre le large... pour l'instant. Face aux lourdes réglementations qui pèsent sur les start-up d'IA générative en Europe, Jean-Louis Quéguiner assure vouloir rester sur le Vieux contient : "Tant que les contraintes (comprendre l'AI Act, ndlr) ne sont pas appliquées et que leur forme définitive reste incertaine, nous pouvons encore croire en l'attractivité européenne et française. Si la situation devient trop complexe, nous devrons nous interroger sur l'avenir et sur la manière de collaborer avec les gouvernements pour faire évoluer les choses", tranche le CEO.