Reddit r/LocalLLaMA·8 juin 2026

QATs Q4_0 from Google have more precision than Q4_K_XL from Unsloth (at least some)

Signal

Hype

En 3 lignesComparaison de quantifications QAT pour Gemma-4 : les Q4_0 de Google contiennent plus de tenseurs en q6_k et f16 que les Q4_K_XL d'Unsloth, expliquant des tailles de fichier plus grandes (5.15 GB vs 4.22 GB pour E4B). Google utilise une stratégie mixte (q6_k sur 2 tenseurs, q4_0 sur 342) tandis qu'Unsloth utilise principalement q4_0 (345 tenseurs).

Lire la source

Ton avis ?

Benchmarks Open source

Résumé généré par Claude — vérifié par l'humain

QATs Q4_0 from Google have more precision than Q4_K_XL from Unsloth (at least some)

Autres angles sur ce sujet