I added native MTP to exo for Qwen3.6 MLX models; here are the exactness and speed results
Signal
78
Hype
15
En 3 lignesContribution à exo : support natif de la prédiction multi-token (MTP) pour modèles Qwen 3.6 MLX. Tests sur 27B (gain 2x à K=2/K=3) et 35B-A3B (gain 1.16x à K=1). Exactitude vérifiée : tokens identiques au chemin greedy, acceptation par ratio probabiliste en sampling.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain