Retour au feed
Reddit r/LocalLLaMA·

QATs Q4_0 from Google have more precision than Q4_K_XL from Unsloth (at least some)

Signal
45
Hype
15
En 3 lignesComparaison de quantifications QAT pour Gemma-4 : les Q4_0 de Google contiennent plus de tenseurs en q6_k et f16 que les Q4_K_XL d'Unsloth, expliquant des tailles de fichier plus grandes (5.15 GB vs 4.22 GB pour E4B). Google utilise une stratégie mixte (q6_k sur 2 tenseurs, q4_0 sur 342) tandis qu'Unsloth utilise principalement q4_0 (345 tenseurs).
Lire la source
Ton avis ?
BenchmarksOpen source

Résumé généré par Claude — vérifié par l'humain