Claude Code : cinq conseils issus du leak pour être plus efficace

Le leak du code source de Claude Code permet de mieux comprendre le fonctionnement de l'agent de code d'Anthropic. Des bonnes pratiques pour optimiser la performance de l'outil ont été révéléées.

Fin mars à la suite d'une mise à jour de routine de Claude Code, un fichier contenant le code l’agent s'est retrouvé publié par erreur. Résultat, 512 000 lignes du code TypeScript de l'agent de code d'Anthropic sont exposées sur le web. Une fuite d'une ampleur inédite qui permet de comprendre avec une précision rare les rouages internes de l'outil. Après une analyse semi-automatisée du code source à l'aide d'un agent de code, et sur la base des premières analyses d'experts, nous vous livrons aujourd'hui les cinq meilleurs conseils pour tirer le maximum de Claude Code au quotidien.

1. Usez et abusez des instructions dans CLAUDE.md

C'est l'enseignement principal de la fuite de Claude Code : le fichier CLAUDE.md est central. Utile pour donner des consignes à l'IA, CLAUDE.md est rechargé par Claude Code à chaque tour de sa boucle agentique, après l'envoi de votre prompt. Il n'est pas traité comme un simple fichier de documentation : dans le code source, il est injecté dans le prompt system avec le même poids qu'une instruction système d'Anthropic. Documentez-y vos conventions de code, les décisions architecturales clés, les pièges connus du projet, et les patterns à suivre ou éviter. Trois niveaux coexistent : le CLAUDE.md à la racine du projet (toujours chargé), ceux placés dans les sous-répertoires (chargés uniquement quand Claude travaille dans le dossier concerné), et un fichier global ~/.claude/CLAUDE.md, appliqué à tous vos projets.

2. Utilisez la compaction à 60% du contexte

Le code source révèle que l'auto-compaction de Claude Code se déclenche quand l'utilisation du contexte atteint 75 à 98% de la fenêtre de contexte du modèle. Or, plus la fenêtre est saturée, plus le résumé doit être agressif, et plus on perd d'informations utiles. Il peut ainsi être bon de compacter manuellement (avec /compact) avant d’atteindre une saturation. Idéalement, autour de 60%, pour maximiser la qualité du résumé et regagner, par la même occasion, en précision (les modèles d’IA perdent en précision sur les très long contextes).

Par ailleurs, la commande /compact accepte des instructions en langage naturel. Il est par exemple possible de demander de compacter la conversation en se concentrant sur un aspect essentiel de votre projet. Plus intelligent encore, il est possible de définir vos préférences de compaction directement dans le fichier… CLAUDE.md pour que l’IA s’en rappelle entre les sessions.

3. Lancer des sous-agents en masse et sans crainte

Le code source de Claude Code révèle également que l'outil Agent, qui permet de lancer des sous-agents au sein de vos projets, attribue à chacun d'eux sa propre fenêtre de contexte, distincte de celle de l'agent principal. Concrètement, chaque sous-agent travaille dans son espace mémoire sans encombrer celui des autres. Les sous-agents héritent du contexte parent via un mécanisme de cache KV (une mémoire tampon), ce qui signifie que toute la partie déjà traitée par l'agent principal n'est pas recalculée. En pratique, lancer cinq sous-agents en parallèle coûte à peine plus qu'un seul, parce que le gros du contexte est déjà en cache.

Partant de là, il est conseillé de demander clairement à Claude Code, dans les instructions (CLAUDE.MD) ou dans vos prompts d’utiliser des sous-agents le plus possible quand la situation le justifie. Exemple : des tâches spécialisées en parallèle (revue de code, test unitaire…) ou pour avancer plus rapidement quand les modifications d’un agent ne risquent pas d’entrer en conflit avec un autre agent.

4. Exigez des réponses courtes

Le code de Claude Code offre une vue sur l'utilisation par les collaborateurs mêmes d'Anthropic de l'agent. Le prompt system de Claude Code n'est pas un bloc fixe mais un assemblage dynamique de plus de 110 composants conditionnels : en fonction du profil de l'utilisateur, du mode d'exécution et de la configuration du projet, certains blocs sont injectés et d'autres non. Pour les employés Anthropic, le prompt inclut des limites strictes : 25 mots maximum entre deux appels d'outils, 100 mots pour les réponses finales. Les utilisateurs externes (la plèbe) reçoivent à la place une formulation plus souple ("go straight to the point.") Or, un commentaire trouvé dans le code note un gain de réduction des tokens de sortie grâce à ces contraintes chiffrées.

Très concrètement, si vous dépassez souvent vos limites d’utilisation, ajoutez dans votre CLAUDE.md des directives pour inviter l’IA à moins parler entre ses actions. Si possible utilisez donc des instructions chiffrées, beaucoup plus efficaces.

5. Créez des to-do list

C'est enfin le conseil le plus original de cet article : demandez à Claude d'utiliser des to-do list pour préserver les tâches essentielles de vos projets sur vos longues sessions de code. Le prompt system de l’agent contient une instruction inhabituelle : "Use TodoWrite/TodoRead VERY frequently." Les to-do sont stockées en dehors du flux de messages, ainsi ils survivent aux compactions de contexte. Quand Claude résume une conversation pour libérer de l'espace, les messages disparaissent mais la to-do list reste intacte.

Pour autant, même si la consigne figure dans le prompt system, Claude ne crée pas systématiquement une to-do list de lui-même : si la tâche ne lui semble pas assez complexe au départ, il peut s'en passer. Pour les tâches impliquant plus de trois ou quatre fichiers, ou les sessions suffisamment longues pour déclencher une compaction, demandez explicitement de créer un plan avec TodoWrite avant de commencer. En cas de perte de contexte, l'agent peut alors relire sa liste et reprendre exactement où il en était.