Retour au feed
Reddit r/LocalLLaMA·

Qwen3.6-35B-A3B Q4 262k context on 8GB 3070 Ti = +30tps

Signal
72
Hype
15
En 3 lignesUtilisateur obtient 30+ tokens/sec avec Qwen3.6-35B-A3B quantifié Q4 sur RTX 3070 Ti 8GB avec contexte 262k. Clé : modèle MoE ne nécessite que 3.5B actif en VRAM. Linux Server (+25% tps vs Windows 11). Contextes jusqu'à 1M possibles mais ralentissement au-delà 150k.
Lire la source
Ton avis ?
QwenOpen source

Résumé généré par Claude — vérifié par l'humain