Reddit r/LocalLLaMA·22 mai 2026

Qwen-27B-IQ4_KS for ik_llama.cpp, especially for NVIDIA with 16GB VRAM

Signal

Hype

En 3 lignesNouvelle quantization Qwen-27B-IQ4_KS optimisée pour GPU NVIDIA 16GB via ik_llama.cpp. Modèle de 14.1GB offrant performances comparables à IQ4_XS précédent, 1.5-1.75x plus rapide, fenêtre contexte 105k tokens. Tests: Needle In Haystack 100k réussi, perplexité 71.10.

Lire la source

Ton avis ?

Qwen Open source Outils Infrastructure

Résumé généré par Claude — vérifié par l'humain

Qwen-27B-IQ4_KS for ik_llama.cpp, especially for NVIDIA with 16GB VRAM

Autres angles sur ce sujet