Retour au feed
Reddit r/LocalLLaMA·

Gemma4 26b a4b Apex quant is quite good

Signal
65
Hype
25
En 3 lignesUtilisateur teste la quantification APEX de Gemma 4 26B sur GPU AMD RX 9060 XT. Obtient 38 tokens/sec à 90k contexte sans dégradation de qualité avec llama.cpp Vulkan. Modèle APEX-I-Compact (15GB) surpasse précédente quant Q5 (21.2GB) qui loopait à 50k contexte.
Lire la source
Ton avis ?
GeminiOpen source

Résumé généré par Claude — vérifié par l'humain