Retour au feed
Reddit r/LocalLLaMA·

1000 tps generation on Qwen3.6 27B with V100s

Signal
45
Hype
35
En 3 lignesUtilisateur rapporte 1000 tokens/s en génération sur Qwen 3.6 27B avec V100s en batch 128, et 80 t/s en single-user (batch 1) sans MTP. Throughput de traitement atteint 3000 t/s.
Lire la source
Ton avis ?
QwenBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain