unsloth vs bartowski MTP ggufs
Signal
72
Hype
15
En 3 lignesBenchmark comparatif des quantifications MTP (Multi-Token Prediction) entre unsloth et bartowski sur Qwen 3.5-4B, 3.5-9B et 3.6-27B. Bartowski utilise Q8_0 pour la tête MTP (fichiers plus volumineux). Tests sur Snapdragon avec Q4_0, IQ4_NL, Q4_1, MXFP4_MOE, Q8_0 limités à 24GB VRAM RTX 3090. Unsloth généralement plus rapide en décodage (t/s) et efficace en VRAM.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain