Gemma 4 QAT accuracy inconsistencies
Signal
35
Hype
15
En 3 lignesAnalyse des incohérences de précision dans la quantification aware training (QAT) de Gemma 4. Le modèle 12B montre des écarts plus importants par rapport à FP16 que les variantes MoE (E2B/E4B), contredisant les attentes théoriques. Demande de clarification sur la méthodologie et comparaisons avec variants non-QAT.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain