Tous les articles GPU
Juillet 2025
-
Arago lève 26 millions de dollars pour commercialiser sa puce IA jusqu'à 10 fois plus économe qu'un GPU
-
Sesterce, un cloud français orienté IA à l'assaut de CoreWeave et Lambda
-
Plus rapides, plus sûrs et plus intelligents : après les LLM, place aux DLLM
Les diffusion large language model commencent à émerger sérieusement dans le paysage de l'IA générative. Ils promettent notamment des vitesses de génération record et une réduction drastique des hallucinations.
-
Comment AWS adapte son infrastructure aux besoins en IA générative
Le cloud américain a choisi de développer ses propres cartes graphiques pour supporter les traitements d'IA générative. En parallèle, il commercialise néanmoins des instances Nvidia.
-
Les "IA factories", futur moteur d'une nouvelle révolution industrielle ?
-
Llama 4 : un triplé gagnant pour Meta, qui bouscule l'IA mondiale
Llama 4 arrive en deux versions différentes avec respectivement 400 et 109 milliards de paramètres. Meta introduit également une fenêtre de contexte à 10 millions de tokens.
-
QwQ-32B, Qwen Max… Quel modèle Alibaba Cloud pour quel usage ?
Alibaba Cloud propose une grande variété de LLM adaptés à la majorité des cas d'usage du marché, pour un prix très compétitif.
-
Michel-Marie Maudet (OpenLLM) : "Lucie.chat, une interface publique accessible à tous, permet d'accéder à notre LLM Lucie"
Michel-Marie Maudet est directeur général de Linagora, à l'initiative de la communauté open source OpenLLM Europe, qui dévoile officiellement ce 23 janvier, Lucie son premier LLM à 7 milliards de paramètres.
-
5 astuces pour faire baisser le coût de l'IA générative