Retour au feed
Reddit r/LocalLLaMA·

MTP hyperparameter search

Signal
45
Hype
15
En 3 lignesRecherche d'hyperparamètres sur MTP et speculative decoding avec llama-server sur Qwen 3.6 27B. Amélioration de 6% (13.24 tokens/sec) via Optuna. Script Python fourni.
Lire la source
Ton avis ?
QwenOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain