Bard vs ChatGPT vs Claude 2 : quelle IA générative est faite pour vous ?

Bard vs ChatGPT vs Claude 2 : quelle IA générative est faite pour vous ? Quelles sont les principales différences entre les chatbots de Google, OpenAI et Anthropic ? La réponse en tableau.

Depuis des mois désormais, les acteurs de l'IA générative bataillent pour développer un chatbot compétitif. Une course à l'intelligence artificielle dominée par trois acteurs, OpenAI, Google et Anthropic, qui s'est accélérée en juillet. OpenAi a dégainé le premier en sortant son plugin Code Interpreter le 7, Anthropic lui a emboîté le pas le 11 en dévoilant son nouveau modèle Claude 2, beaucoup plus efficient que la première version, avant que dans la foulée, le 13, Google déploie en Europe Bard, avec la prise en charge de la multimodalité basée sur Google Lens. Comme toute course entre champion, celle-ci s'avère difficile à suivre. Voici donc ci-dessous un point d'étape sur les capacités de chacun.

Bard, ChatGPT, Claude 2 : comparatif au 13 juillet
 

ChatGPT

Bard

Claude 2

Développeur

OpenAI

Google

Anthropic

Disponible en France

Oui

Oui

Non

Multimodalité

Oui, avec Code Interpreter

Oui, en Anglais

Oui

Fonctionnalités premium

GPT-4, priorité d'accès, plugin, Code Interpreter

Non

Non

Longueur de prompt théorique

30 000 mots (avec GPT-4)

10 000 mots

75 000 mots

Dernière mise à jour "officielle" des données

Septembre 2021

Temps réel

Début 2023

API

OpenAI API

Cloud's AI Trusted Tester Program

Anthropic API

Connexion à internet

Non

Oui

Non

Prix de l'API

Entre 0,03 $ et 0,06 $ / 750 mots

ND

0.0465 $ / 1 000 mots

Plugin(s) disponible(s)

Oui

Non

Non

Qualité du texte généré en français

Haute

Bonne

Faible

Éthique du modèle

Moyenne

Bonne

Bonne

Temps de réponse

Moyen (avec GPT-4)

Rapide

Rapide

Nombre de paramètres

530 millions

1,3 million

1,6 million

Quel modèle faut-il choisir aujourd'hui et pour quel usage ?

Pour le moment, seuls ChatGPT - et ses modèles sous-jacents GPT-4 et GPT-3.5 - et Claude 2 sont destinés à un usage professionnel. Bard ne dispose pas encore d'API ouverte au public, les éditeurs sont dans l'obligation de s'inscrire sur le Cloud's AI Trusted Tester Program de Google pour réussir à intégrer Bard à leurs applications. Du côté d'Anthropic et d'OpenAI, l'intégration est beaucoup plus simple. Il suffit de créer un compte et de renseigner les informations de facturation pour utiliser l'API.

Côté multimodalité, les trois modèles sont maintenant capables de traiter des fichiers en entrée de prompt. Bard réserve la possibilité d'uploader des images pour les analyser mais uniquement dans sa version anglophone. ChatGPT peut traiter différents types de fichier, des images aux fichiers PDF en utilisant Code Interpreter. Claude 2 permet également de soumettre des fichiers textuels (PDF, CSV, DOCX…).

Quel modèle est le plus qualitatif ?

D'un point de vue qualitatif, GPT-4 continue de proposer des réponses plus structurées avec un langage riche et un contexte pertinent. De son côté Bard semble suivre la logique de la transformation des Serp et propose de l'information très pratique, souvent brève et présentée sous forme de liste à puce. Enfin Claude 2 répond très classiquement mais, en français, son vocabulaire est peu diversifié et ses informations moins pertinentes.

Concernant la fraîcheur des informations, Bard gagne haut la main. L'IA de Google étant connectée à Internet, elle génère des réponses plus récentes mais manque encore de fiabilité. Lors de nos tests, le chatbot a été victime d'hallucination à de multiples reprises. Claude 2 ne fait pas beaucoup mieux mais semble toutefois moins sujet à l'AI hallucination. Ses données ont le mérite d'être plus à jour que celles des modèles d'OpenAI, l'IA ayant emmagasiné son dataset jusqu'en début d'année 2023. Enfin ChatGPT - bien qu'il ne dispose plus d'un accès au web - répond de manière générale plutôt correctement, mais ses données, arrêtées en septembre 2021, l'handicapent fortement.

Prompt : "Génère un article sur les dangers du soleil en été." De bas en haut : Claude 2, Bard, GPT-4. © Capture d'écran

Dans la majorité des cas, l'intégration de l'IA générative dans l'applicatif ne nécessite pas de données récentes. Il semble alors pertinent de recourir à Claude 2 pour des tâches basiques en raison de son faible coût et à GPT-4 pour des tâches plus complexes. Enfin de manière alternative, les modèles de précédentes générations chez OpenAI - à l'image de text-curie-001, text-babbage-001 ou encore text-ada-001 - sont suffisants pour gérer des tâches élémentaires comme de la traduction, le classement ou encore de la synthèse. Leur rapidité et leur rapport qualité / prix en font des modèles toujours incontournables en 2023.