Retour au feed
Reddit r/LocalLLaMA·

Qwen 3.6 35B GGUF: NTP vs MTP quantization results across GPUs and CPUs

Signal
75
Hype
25
En 3 lignesByteShape publie des quantifications GGUF de Qwen 3.6 35B en deux variantes : NTP et MTP. Tests sur RTX 4090/5090, Intel i7/Ultra 7, Ryzen 9, Raspberry Pi 5. Résultat clé : le plus grand modèle reste compétitif en qualité et vitesse. MTP offre 20-40% de boost GPU mais augmente la mémoire. NTP recommandé pour CPU.
Lire la source
Ton avis ?
QwenOpen sourceBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain