Reddit r/LocalLLaMA·14 juin 2026

Strange numbers of pp and tg rx7900xtx on ROCm and Vulcan with Qwen3.6-27b nonMTP and MTP

Signal

Hype

En 3 lignesUtilisateur rapporte des performances décevantes avec Qwen 3.6-27B sur RX 7900 XTX via ROCm et Vulkan avec llama.cpp. Prompt processing: 235-634 tok/s selon backend, génération: 13-31 tok/s. MTP (speculative decoding) n=3 réduit la génération à 17 tok/s malgré 78% d'acceptation.

Lire la source

Ton avis ?

Qwen Open source Benchmarks Infrastructure

Résumé généré par Claude — vérifié par l'humain

Strange numbers of pp and tg rx7900xtx on ROCm and Vulcan with Qwen3.6-27b nonMTP and MTP

Autres angles sur ce sujet