minor speed bump for MTP with Qwen3.6-27B-MTP Q6_K_XL
Signal
35
Hype
15
En 3 lignesBenchmark personnel sur MacBook M5 Max : Qwen 3.6-27B-UD-Q6_K_XL avec MTP atteint 22.3 tokens/s vs 19 tokens/s sans MTP via llama.cpp. Amélioration modeste (17%) comparée aux gains rapportés ailleurs.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain