Qwen 3.6 35B GGUF: NTP vs MTP quantization results across GPUs and CPUs
Signal
75
Hype
25
En 3 lignesByteShape publie des quantifications GGUF de Qwen 3.6 35B en deux variantes : NTP et MTP. Tests sur RTX 4090/5090, Intel i7/Ultra 7, Ryzen 9, Raspberry Pi 5. Résultat clé : le plus grand modèle reste compétitif en qualité et vitesse. MTP offre 20-40% de boost GPU mais augmente la mémoire. NTP recommandé pour CPU.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain