Retour au feed
Reddit r/LocalLLaMA·

RTX 5080 + RTX 3090 Setup: 80+ Tok/s on Qwen 3.6 27B Q8

Signal
35
Hype
25
En 3 lignesUtilisateur rapporte 80+ tokens/s avec Qwen 3.6 27B quantifié Q8 sur setup dual GPU (RTX 5080 + RTX 3090). Performance mesurée sur infrastructure locale sans détails de framework ou conditions de test.
Lire la source
Ton avis ?
QwenOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain