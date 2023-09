Hugging Face met à la disposition du grand public, via son interface HuggingChat Llama 2, le large langage model open source de Meta. L'accès est simple et très rapide.

Le 18 juillet dernier, Meta a annoncé publiquement l'arrivée de Llama 2. Avec plus de 70 milliards de paramètres dans sa version la plus avancée, le modèle est devenu l'un des plus grands LLM publiés en open source. Llama 2 est arrivé sur le marché moins de six mois après Llama 1. Une première mouture qui en quelques mois avait connu un véritable succès auprès de la communauté de l'IA avec pas moins de 100 000 demandes d'accès recensées jusqu'en juillet 2023.

Llama 2 est proposé en trois versions, avec 7, 13 ou bien 70 milliards de paramètres, selon les besoins de l'utilisateur final. Pour maximiser la qualité des réponses de l'IA, Meta a entraîné son modèle sur 40% de données en plus que Llama 1. Selon Meta, la version actuelle de Llama "surpasse d'autres modèles linguistiques open sources dans de nombreux tests de référence externes, notamment des tests de raisonnement, de codage, de compétence et de connaissance." Depuis son lancement, le modèle est disponible nativement dans les catalogues d'Azure, avec l'ensemble des fonctionnalités de sécurité développées par Microsoft. Amazon Web Service propose également une offre dédiée.

Une version optimisée pour le dialogue

Très rapidement, la communauté mondiale de l'open source s'est saisie de Llama 2. Quelques jours après l'annonce de la maison de mère de Facebook, Llama 2 était déjà disponible sur Hugging Face, la plateforme franco-américaine de machine learning open source grâce à une étroite collaboration entre les deux sociétés. En plus de l'accès classique au modèle, Hugging Face a implémenté la version fine tunée pour le chat à son interface open source Hugging Chat. Le modèle a été optimisé pour le dialogue en langage naturel au moyen d'apprentissage par renforcement à partir de la rétroaction humaine (Reinforcement learning from human feedback), comme GPT-4 d'OpenAI.

Llama 2 est le modèle par défaut de Hugging Chat. © Capture d'écran

Hugging Chat permet ainsi, de manière très simple, d'utiliser Llama 2. Pour ce faire, rendez-vous sur huggingface.co/chat/. L'interface est classique, très similaire à celle de Claude 2 ou ChatGPT. Initialement, Hugging Chat utilisait le modèle OpenAssistan (OpenAssistant/oasst-sft-6-llama-30b) de LAION pour fonctionner. Assurez-vous avant de débuter votre conversation avec l'IA que l'interface soit bien paramétrée sur le modèle de Llama 2 (meta-llama/Llama-2-70b-chat-hf, en août 2023). Vous pouvez ensuite dialoguer avec l'IA de manière naturelle.

Llama 2 comprend très bien le français. © Capture d'écran

Attention toutefois, l'interface vous demandera de vous connecter après avoir posé une seule question. La création d'un compte est entièrement gratuite et permet d'accéder par la suite de manière illimitée à l'interface.

Qu'est-il possible de faire avec Llama 2 ?

Llama 2 permet comme ChatGPT, Claude 2, Bard ou tout autre LLM de générer du texte. Dans sa version actuelle, le modèle de Meta ne supporte pas la multimodalité (images, vidéos…). Une checkbox "Search web" permet, en théorie, de connecter LLama 2 au web via Google pour rechercher des informations actualisées. Selon nos tests, la fonctionnalité peut générer quelques erreurs. En pratique, le modèle de Meta peut gérer, entre le prompt et la sortie, 4 096 tokens, soit environ 16 000 caractères en anglais. En comparaison, GPT-4 dispose de 32 768 tokens au maximum dans sa version 32K.

Llama 2 se connecte à Google pour la recherche web. © Capture d'écran

Point notable, de par son entraînement récent (entre janvier et juillet 2023), Llama 2 dispose d'informations très récentes. Un véritable plus en comparaison aux modèles similaires, alors entraînés jusqu'en 2022 pour les plus récents. La qualité des réponses de l'IA est relativement bonne, comparable à GPT-3.5. Il est possible d'utiliser le modèle de Meta pour

coder

traduire du texte

résumer un texte

analyser des données brutes (via un copié / collé) notamment.

Selon Meta, Llama 2 est plus sécurisé que la plupart des autres modèles open source comparables du marché. Selon nos tests, l'IA n'a pas tendance à halluciner régulièrement, comme cela pouvait être le cas pour les LLM concurrentes à leur début.