Retour au feed
Reddit r/LocalLLaMA·

125 tok/s for Qwen3.6 q4xl on 2x 4060ti is insane perf/dollar

Signal
45
Hype
35
En 3 lignesUtilisateur rapporte 125 tokens/s avec Qwen 3.6 quantifié Q4 sur 2x RTX 4060 Ti (~1000$, 32GB VRAM). Performance supérieure aux mini-PC haut de gamme 2026 pour fraction du coût. Teste l'optimisation CUDA 13.3 pour atteindre 150 tok/s.
Lire la source
Ton avis ?
QwenOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain