Retour au feed
Reddit r/LocalLLaMA·

ByteShape Qwen3.6-35B-A3B: 30% faster than Unsloth IQ on 6GB VRAM laptop

Signal
72
Hype
25
En 3 lignesByteShape propose une quantification CPU-5 pour Qwen3.6-35B-A3B offrant 30% plus rapide en génération de texte que Unsloth UD-IQ4_XS sur GPU laptop 6GB VRAM, avec légère perte en vitesse de pré-remplissage. Test sur RTX 3060 avec contexte 65536 tokens.
Lire la source
Ton avis ?
QwenOpen sourceOutilsBenchmarks

Résumé généré par Claude — vérifié par l'humain