Strange numbers of pp and tg rx7900xtx on ROCm and Vulcan with Qwen3.6-27b nonMTP and MTP
Signal
35
Hype
15
En 3 lignesUtilisateur rapporte des performances décevantes avec Qwen 3.6-27B sur RX 7900 XTX via ROCm et Vulkan avec llama.cpp. Prompt processing: 235-634 tok/s selon backend, génération: 13-31 tok/s. MTP (speculative decoding) n=3 réduit la génération à 17 tok/s malgré 78% d'acceptation.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain