Après avoir levé 750 millions de dollars, la start-up californienne a lancé, cet été, la version 2 de Claude, son IA conversationnelle. Fondée par deux anciens d'OpenAI, elle se présente comme l'alternative la plus crédible à ChatGPT.

Un signe de crédibilité qui ne trompe pas. En mai dernier, quatre entreprises seulement étaient invitées à la Maison Blanche pour échanger avec la vice-présidente Kamala Harris sur l'IA générative : OpenAI, créateur du célèbre ChatGPT, Alphabet, maison-mère de Google, Microsoft et... Anthropic. Méconnue du grand public, cette start-up californienne s'est imposée en quelques mois comme le concurrent le plus sérieux d'OpenAI. Les investisseurs ne s'y sont pas trompés. Fondée par deux anciens responsables d'OpenAI, la société de San Francisco a levé 750 millions de dollars depuis le début de l'année. Ce qui la valorise, après seulement deux ans d'existence, à 4,1 milliards de dollars.

Sur le marché encore balbutiant de l'IA générative, Anthropic a davantage la cote que d'autres jeunes pousses spécialisées comme Cohere, AI21 Labs, Inflection AI, ou Stability AI. Ses prestigieux investisseurs, parmi lesquels on trouve Google, Salesforce, SAP ou Zoom, misent sur son chatbot, Claude, dont la nouvelle version a été présentée le 11 juillet 2023, pour contester la suprématie mondiale de ChatGPT d'OpenAI.

Depuis le lancement de ChatGPT fin 2022, OpenAI ne rencontre pas, de fait, de véritable concurrence. Lancé à la hâte, en mars dernier par Google, Bard n'a pas (encore) convaincu. Pour surpasser GPT-4, Google s'en remettrait désormais à Gemini, un projet que porte son laboratoire DeepMind et qui devrait aboutir d'ici la fin de l'année. La firme de Mountain View ne met toutefois pas tous ses œufs dans le même panier et a investi 300 millions dans Anthropic. En quelque sorte la réponse du berger à la bergère en direction de Microsoft qui, lui, a injecté des milliards dans OpenAI.

Slack, Zoom et AWS comme partenaires

Basé sur de grands modèles de langage (LLM), Claude répond à des questions et des prompts en langage naturel. Comme ChatGPT, l'IA multimodale est capable de générer ou résumer du texte, de produire du code informatique ou de résoudre des problèmes de mathématiques. Claude cultive néanmoins sa différence face à son encombrant concurrent. Les deux fondateurs d'Anthropic, Daniela Amodei et son frère Dario, ont d'emblée orienté leur IA vers le monde de l'entreprise. Elle compte le forum de discussions Quora, le moteur de recherche DuckDuckGo ou la plateforme de rédaction de contrats Robin AI comme références.

Parmi les cas d'usage les plus fréquents, Claude peut déceler l'intention d'un client et orienter sa demande vers l'agent le plus pertinent voire lui répondre automatiquement. Dans le cadre d'une activité juridique ou de R&D, le chatbot peut indexer un grand nombre de contenus, les synthétiser et répondre à des requêtes. Plus généralement, il se présente comme un assistant personnel déchargeant le collaborateur de tâches chronophages. Il suffit, par exemple, d'uploader un document pour que Claude le résume sous forme de liste à puces.

"Claude 2 peut être utilisé dans un environnement professionnel en termes de qualité et de pertinence des contenus"

Pour favoriser son emprise en milieu professionnel, Anthropic a multiplié les partenariats avec des éditeurs tiers. Intégré à un fil de discussion, Claude converse automatiquement avec les utilisateurs de Slack, la plateforme de collaboration de Salesforce. Le chatbot est aussi intégré à Notion, une solution de productivité no code, ou encore à Jasper, un outil de génération automatique de texte orienté marketing.

Dans le domaine du cloud, Amazon Web Services donne accès à l'API de Claude 2 via Amazon Bedrock, son service dédié à l'IA générative. En mai, Zoom a aussi annoncé que Claude sera intégré à ses différentes solutions en commençant par Zoom Contact Center. L'assistant intelligent aidera les opérateurs d'un centre de contacts basé sur Zoom à mieux comprendre et résoudre les problèmes rencontrés par un client.

Réduire les hallucinations et les contenus toxiques

Avec Claude 2, l'IA d'Anthropic repousse aussi les limites de son concurrent. Alors que ChatGPT peut absorber un texte comprenant jusqu'à 3 000 mots et 10 000 dans la version payante, le chatbot d'Anthropic analyse jusqu'à 75 000 mots, soit la longueur du roman Gatsby le Magnifique. Les tarifs de la version payante restent inchangés avec le changement de version. La structure de coûts est rapportée à la notion de jeton – 100 000 jetons correspondant à environ 70 000 mots. Soit un peu plus de 11 dollars par million de jetons pour les prompts et 32,7 dollars par million de jetons pour les résultats.

Anthropic a également amélioré les performances de son IA conversationnelle. Selon le billet de blog de présentation de Claude 2, la nouvelle version a obtenu une note de 76,5% à l'examen du Barreau, contre 73% pour Claude 1.3. Elle a aussi décroché un score de 88% au test GSM8k qui réunit un grand nombre de problèmes de mathématiques de niveau scolaire et de 71,2% au test de codage Python Codex HumanEval, contre respectivement 85,2% et 56% précédemment.

Anthropic affirme, par ailleurs, avoir renforcé ses mécanismes de sécurité pour réduire les risques de jailbreak. C'est-à-dire les tentatives de détournement qui consisteraient à utiliser le chatbot à des fins malveillantes pour produire, par exemple, des contenus toxiques sur les réseaux sociaux. Claude 2 serait ainsi deux fois plus pertinent que Claude 1.3 pour donner des réponses inoffensives. Dans son avertissement aux utilisateurs, Anthropic rappelle à toutes fins utiles que son chatbot n'est pas destiné à délivrer un conseil médical, légal ou financier.

Informations en temps réel

Selon Anthropic, Claude 2 est capable de mieux comprendre le contexte général d'une conversation et de gagner en pertinence. La start-up s'attelle notamment à lutter contre les biais et les phénomènes d'hallucination, à savoir les informations factuellement incorrectes ou absurdes. Elle indique aussi adapter ses réponses en fonction du profil de l'utilisateur. A la différence de ChatGPT dont les connaissances se limitent à la période précédent septembre 2021, Claude 2 a accès à des informations et données mises à jour en temps réel. En revanche, l'assistant ne mentionne pas les sources des articles qu'il utilise pour produire ses réponses.

Ouverte depuis le 11 juillet 2023, la bêta publique de Claude 2 n'est, pour l'heure, disponible qu'aux États-Unis et au Royaume-Uni et. En passant par un VPN, il est néanmoins possible de tester cette version 2 dont le lancement mondial est prévu dans quelques mois. PDG de l'agence SLN, Ludovic Salenne estime dans une vidéo sur YouTube que Claude 2 constitue le principal concurrent à ChatGPT-4. "Il peut être utilisé dans un environnement professionnel en termes de qualité et de pertinence des contenus, ce qui le différencie d'autres outils comme Bard ou Bing Chat", précise-t-il.