$400 Qwen 3.6-27B Setup - Dual RTX 3060 - 30-50 t/s
Signal
65
Hype
15
En 3 lignesConfiguration budget à 400$ avec deux RTX 3060 (24GB total) pour exécuter Qwen 3.6-27B. Vitesse de décodage 30-50 t/s sur llama.cpp avec quantization Q4_K_S. Plateforme i7-4770K ancienne mais supportant PCIe 3.0 x8 dual, comparable aux setups modernes. Limitation : pas de KV cache quantization avec tensor parallel, contexte limité à 64k.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain