Retour au feed
Reddit r/LocalLLaMA·

DGX Spark agentic usage numbers

Signal
45
Hype
15
En 3 lignesUtilisateur teste des modèles LLM pour supporter des agents multi-utilisateurs (type openclaw). Atlas échoue (tool calls cassés, Qwen3-coder incompatible, 50 TPS en contexte long). RedHatAI/Qwen3.6-35B-A3B-NVFP4 fonctionne : 51 TPS single-stream, 139 TPS en 4 concurrent (30k contexte), taux d'acceptation draft 77.8%.
Lire la source
Ton avis ?
QwenAgents IABenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain