Gemma4 26b a4b Apex quant is quite good
Signal
65
Hype
25
En 3 lignesUtilisateur teste la quantification APEX de Gemma 4 26B sur GPU AMD RX 9060 XT. Obtient 38 tokens/sec à 90k contexte sans dégradation de qualité avec llama.cpp Vulkan. Modèle APEX-I-Compact (15GB) surpasse précédente quant Q5 (21.2GB) qui loopait à 50k contexte.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain