Bard vs ChatGPT vs Claude 2 : quelle IA générative est faite pour vous ?

Quelles sont les principales différences entre les chatbots de Google, OpenAI et Anthropic ? La réponse en tableau.

Depuis des mois désormais, les acteurs de l'IA générative bataillent pour développer un chatbot compétitif. Une course à l'intelligence artificielle dominée par trois acteurs, OpenAI, Google et Anthropic, qui s'est accélérée en juillet. OpenAi a dégainé le premier en sortant son plugin Code Interpreter le 7, Anthropic lui a emboîté le pas le 11 en dévoilant son nouveau modèle Claude 2, beaucoup plus efficient que la première version, avant que dans la foulée, le 13, Google déploie en Europe Bard, avec la prise en charge de la multimodalité basée sur Google Lens. Comme toute course entre champion, celle-ci s'avère difficile à suivre. Voici donc ci-dessous un point d'étape sur les capacités de chacun.

Bard, ChatGPT, Claude 2 : comparatif au 13 juillet
	ChatGPT	Bard	Claude 2
Développeur	OpenAI	Google	Anthropic
Disponible en France	Oui	Oui	Non
Multimodalité	Oui, avec Code Interpreter	Oui, en Anglais	Oui
Fonctionnalités premium	GPT-4, priorité d'accès, plugin, Code Interpreter	Non	Non
Longueur de prompt théorique	30 000 mots (avec GPT-4)	10 000 mots	75 000 mots
Dernière mise à jour "officielle" des données	Septembre 2021	Temps réel	Début 2023
API	OpenAI API	Cloud's AI Trusted Tester Program	Anthropic API
Connexion à internet	Non	Oui	Non
Prix de l'API	Entre 0,03 $ et 0,06 $ / 750 mots	ND	0.0465 $ / 1 000 mots
Plugin(s) disponible(s)	Oui	Non	Non
Qualité du texte généré en français	Haute	Bonne	Faible
Éthique du modèle	Moyenne	Bonne	Bonne
Temps de réponse	Moyen (avec GPT-4)	Rapide	Rapide
Nombre de paramètres	530 millions	1,3 million	1,6 million

Quel modèle faut-il choisir aujourd'hui et pour quel usage ?

Pour le moment, seuls ChatGPT - et ses modèles sous-jacents GPT-4 et GPT-3.5 - et Claude 2 sont destinés à un usage professionnel. Bard ne dispose pas encore d'API ouverte au public, les éditeurs sont dans l'obligation de s'inscrire sur le Cloud's AI Trusted Tester Program de Google pour réussir à intégrer Bard à leurs applications. Du côté d'Anthropic et d'OpenAI, l'intégration est beaucoup plus simple. Il suffit de créer un compte et de renseigner les informations de facturation pour utiliser l'API.

Côté multimodalité, les trois modèles sont maintenant capables de traiter des fichiers en entrée de prompt. Bard réserve la possibilité d'uploader des images pour les analyser mais uniquement dans sa version anglophone. ChatGPT peut traiter différents types de fichier, des images aux fichiers PDF en utilisant Code Interpreter. Claude 2 permet également de soumettre des fichiers textuels (PDF, CSV, DOCX…).

Quel modèle est le plus qualitatif ?

D'un point de vue qualitatif, GPT-4 continue de proposer des réponses plus structurées avec un langage riche et un contexte pertinent. De son côté Bard semble suivre la logique de la transformation des Serp et propose de l'information très pratique, souvent brève et présentée sous forme de liste à puce. Enfin Claude 2 répond très classiquement mais, en français, son vocabulaire est peu diversifié et ses informations moins pertinentes.

Concernant la fraîcheur des informations, Bard gagne haut la main. L'IA de Google étant connectée à Internet, elle génère des réponses plus récentes mais manque encore de fiabilité. Lors de nos tests, le chatbot a été victime d'hallucination à de multiples reprises. Claude 2 ne fait pas beaucoup mieux mais semble toutefois moins sujet à l'AI hallucination. Ses données ont le mérite d'être plus à jour que celles des modèles d'OpenAI, l'IA ayant emmagasiné son dataset jusqu'en début d'année 2023. Enfin ChatGPT - bien qu'il ne dispose plus d'un accès au web - répond de manière générale plutôt correctement, mais ses données, arrêtées en septembre 2021, l'handicapent fortement.

Prompt : "Génère un article sur les dangers du soleil en été." De bas en haut : Claude 2, Bard, GPT-4. © Capture d'écran

Dans la majorité des cas, l'intégration de l'IA générative dans l'applicatif ne nécessite pas de données récentes. Il semble alors pertinent de recourir à Claude 2 pour des tâches basiques en raison de son faible coût et à GPT-4 pour des tâches plus complexes. Enfin de manière alternative, les modèles de précédentes générations chez OpenAI - à l'image de text-curie-001, text-babbage-001 ou encore text-ada-001 - sont suffisants pour gérer des tâches élémentaires comme de la traduction, le classement ou encore de la synthèse. Leur rapidité et leur rapport qualité / prix en font des modèles toujours incontournables en 2023.