Qwen3.6-35B-A3B Q4 262k context on 8GB 3070 Ti = +30tps
Signal
72
Hype
15
En 3 lignesUtilisateur obtient 30+ tokens/sec avec Qwen3.6-35B-A3B quantifié Q4 sur RTX 3070 Ti 8GB avec contexte 262k. Clé : modèle MoE ne nécessite que 3.5B actif en VRAM. Linux Server (+25% tps vs Windows 11). Contextes jusqu'à 1M possibles mais ralentissement au-delà 150k.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain