Retour au feed
Reddit r/LocalLLaMA·

minor speed bump for MTP with Qwen3.6-27B-MTP Q6_K_XL

Signal
35
Hype
15
En 3 lignesBenchmark personnel sur MacBook M5 Max : Qwen 3.6-27B-UD-Q6_K_XL avec MTP atteint 22.3 tokens/s vs 19 tokens/s sans MTP via llama.cpp. Amélioration modeste (17%) comparée aux gains rapportés ailleurs.
Lire la source
Ton avis ?
QwenBenchmarksGénération de code

Résumé généré par Claude — vérifié par l'humain