Qwen 3.6 benchmarks on 2x RTX PRO 6000
Signal
72
Hype
15
En 3 lignesBenchmarks de Qwen 3.6 sur 2x RTX PRO 6000 avec vLLM. Qwen 3.6 27B BF16 atteint 1800 tps (64 concurrency, MTP-2). Qwen 3.6 35B BF16 atteint 3500 tps en génération (128 concurrency, MTP-Off) avec 30k tps en traitement de prompts.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain