Performances, vitesse, prix : le coup de force de Grok-4 Fast

Lancé par xAI en septembre dernier, Grok-4 Fast affiche des performances on-par avec la majorité des modèles de raisonnement propriétaire pour un prix plus qu'attractif.

C’est encore une performance signée xAI. Si l’entreprise fondée par Elon Musk en 2023 ne fanfaronne pas tous les mois avec de nouveaux modèles toujours plus gros et plus puissants, ses ingénieurs n’en travaillent pas moins pour autant. Lancé en septembre, Grok-4 Fast illustre parfaitement cette approche. Le modèle offre des capacités de pointe dans les benchmarks pour un coût relativement abordable pour les entreprises.

Des performances de pointe en raisonnement

Grok-4 Fast a été pré-entraîné sur un vaste dataset comprenant, en plus des données du web ouvert, des données qualitatives achetées par xAI, des retours venant des utilisateurs de Grok et des données synthétiques générées en interne. Pour améliorer ses performances, le modèle a ensuite été post-entraîné via un arsenal de techniques de reinforcement learning (RL) à grande échelle. Son raisonnement a été ainsi optimisé pour être aussi performant que d’autres modèles tout en réduisant massivement l’utilisation de tokens de raisonnement (40% en moins par rapport à Grok-4). Enfin, les chercheurs ont également entraîné le modèle en RL à l’appel d’outils externes.

En résulte un très bon modèle de raisonnement, efficace par nature. Dans les benchmarks de raisonnement, Grok-4 Fast affiche des scores compétitifs face aux modèles propriétaires de ses concurrents : il atteint 85,7% sur GPQA Diamond (questions de physique, biologie et chimie de niveau doctorat), soit un niveau équivalent à GPT-5 High, et obtient 92,0% sur AIME 2025 (examen de mathématiques pré-universitaires). Sur HMMT 2025 (compétition universitaire de mathématiques avancées), le modèle culmine à 93,3%, surpassant Grok 4 qui plafonne à 90,0%. Et sur LiveCodeBench (évaluation de génération de code sur des problèmes récents) évalué entre janvier et mai, Grok-4 Fast signe un score de 80,0%, se plaçant devant son prédécesseur mais derrière les 86,8% de GPT-5 High. En bref, des performances de pointe en raisonnement général, mathématiques et code. Une excellente composition pour un modèle généraliste.

Enfin, côté vitesse, le modèle reste dans le haut du panier. Grok-4 Fast est disponible, depuis chez xAI, à une vitesse de 227 tokens par seconde, derrière Gemini 2.5 Flash (268 tokens / seconde) et gpt-oss-120B (3128 tokens par seconde depuis Cerebras).

Grok-4 Fast est dans le haut du panier en matière de vitesse. © Capture d’écran / JDN

L’intelligence maximale à prix mini

Les performances sont d’autant plus exceptionnelles en comparaison du coût proposé par xAI. La start-up basée à San Francisco est parvenue, en optimisant le modèle, et certainement son infrastructure, à réduire le prix de 98% par rapport à Grok-4 pour des performances comparables. Selon Artificial Analysis, le modèle offre le meilleur ratio intelligence / coût du marché pour un modèle propriétaire.

Concrètement, Grok-4 Fast facture 0,20 dollar le million de tokens en entrée et 0,50 dollar en sortie pour les contextes inférieurs à 128 000 tokens, soit respectivement 6 et 20 fois moins cher que GPT-5. L'écart se creuse davantage face à Claude Sonnet 4.5 d'Anthropic, dont les tarifs s'élèvent à 3,00 dollars par million de tokens en entrée et 15,00 dollars en sortie, représentant un surcoût de 15 et 30 fois respectivement. Même dans sa configuration étendue (au-delà de 128 000 tokens), où Grok-4 Fast double ses tarifs à 0,50 dollar en entrée et 1,00 dollar en sortie, le modèle de xAI conserve un avantage tarifaire.

Modèle	Prix input (par million tokens)	Prix output (par million tokens)
Grok-4 Fast (≤128k)	0.20 $	0.50 $
Grok-4 Fast (>128k)	0.50 $	1 $
GPT-5 (Standard)	1.25 $	10.00 $
Claude Sonnet 4.5	3.00 $	15.00 $
Gemini 2.5 Pro (≤200K)	1.25 $	10.00 $
Gemini 2.5 Pro (>200K)	2.50 $	15.00 $

Pour l’agentique, le code, ou en copilot d’entreprise…

La combinaison d’excellents résultats dans les benchmarks, d’une tarification attractive et d’une vitesse compétitive font de Grok-4 Fast un candidat idéal pour de nombreux cas d’usage en entreprise. A commencer par l’agentique : le modèle a été spécifiquement entraîné en reinforcement learning pour l'appel d'outils externes, lui permettant de naviguer efficacement sur le web et de synthétiser des informations en temps réel. Il sera ainsi un excellent orchestrateur à un prix raisonnable.

Côté code, les développeurs ont tout intérêt à l’adopter pour le développement agentique. Le modèle offre un prix raisonnable à sa fenêtre de contexte de 2 millions de tokens est idéale pour les grandes bases de code. Enfin, le modèle s'impose comme un choix rationnel pour les copilotes d'entreprise à grande échelle, où le volume de requêtes quotidiennes peut rapidement générer des coûts importants, notamment pour les entreprises se servant chez OpenAI.

Le chemin parcouru par xAI depuis sa fondation en 2023 force l'admiration, surtout dans un secteur dominé par des acteurs établis depuis plusieurs années (OpenAI, Anthropic ou Google). En à peine deux ans d'existence, l'entreprise a réussi à développer une gamme de modèles compétitifs. En capitalisant sur une philosophie d’ingénierie agressive focalisée sur le delivery, la réduction des coûts, xAI se positionne aujourd’hui comme une alternative plus que crédible.