Reddit r/LocalLLaMA·23 mai 2026

DGX Spark agentic usage numbers

Signal

Hype

En 3 lignesUtilisateur teste des modèles LLM pour supporter des agents multi-utilisateurs (type openclaw). Atlas échoue (tool calls cassés, Qwen3-coder incompatible, 50 TPS en contexte long). RedHatAI/Qwen3.6-35B-A3B-NVFP4 fonctionne : 51 TPS single-stream, 139 TPS en 4 concurrent (30k contexte), taux d'acceptation draft 77.8%.

Lire la source

Ton avis ?

Qwen Agents IA Benchmarks Infrastructure

Résumé généré par Claude — vérifié par l'humain

DGX Spark agentic usage numbers

Autres angles sur ce sujet