Reddit r/LocalLLaMA·20 mai 2026

Qwen 3.6 35B GGUF: NTP vs MTP quantization results across GPUs and CPUs

Signal

Hype

En 3 lignesByteShape publie des quantifications GGUF de Qwen 3.6 35B en deux variantes : NTP et MTP. Tests sur RTX 4090/5090, Intel i7/Ultra 7, Ryzen 9, Raspberry Pi 5. Résultat clé : le plus grand modèle reste compétitif en qualité et vitesse. MTP offre 20-40% de boost GPU mais augmente la mémoire. NTP recommandé pour CPU.

Lire la source

Ton avis ?

Qwen Open source Benchmarks Infrastructure

Résumé généré par Claude — vérifié par l'humain

Qwen 3.6 35B GGUF: NTP vs MTP quantization results across GPUs and CPUs

Autres angles sur ce sujet