Retour au feed
Reddit r/LocalLLaMA·

Strange numbers of pp and tg rx7900xtx on ROCm and Vulcan with Qwen3.6-27b nonMTP and MTP

Signal
35
Hype
15
En 3 lignesUtilisateur rapporte des performances décevantes avec Qwen 3.6-27B sur RX 7900 XTX via ROCm et Vulkan avec llama.cpp. Prompt processing: 235-634 tok/s selon backend, génération: 13-31 tok/s. MTP (speculative decoding) n=3 réduit la génération à 17 tok/s malgré 78% d'acceptation.
Lire la source
Ton avis ?
QwenOpen sourceBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain