Retour au feed
Reddit r/LocalLLaMA·

This is amazing. Token speed doubled + kv cache now need low vram - qwen 27b

Signal
35
Hype
65
En 3 lignesQwen 27B affiche une vitesse de génération doublée et une consommation VRAM réduite (21 GB → 17,5 GB) sur le même matériel, sans perte de précision contextuelle.
Lire la source
Ton avis ?
QwenOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain