Retour au feed
Reddit r/LocalLLaMA·

Gemma 4 QAT accuracy inconsistencies

Signal
35
Hype
15
En 3 lignesAnalyse des incohérences de précision dans la quantification aware training (QAT) de Gemma 4. Le modèle 12B montre des écarts plus importants par rapport à FP16 que les variantes MoE (E2B/E4B), contredisant les attentes théoriques. Demande de clarification sur la méthodologie et comparaisons avec variants non-QAT.
Lire la source
Ton avis ?
GeminiBenchmarks

Résumé généré par Claude — vérifié par l'humain