arXiv cs.CL·20 mai 2026

K-Quantization and its Impact on Output Performance

Signal

Hype

En 3 lignesÉtude empirique de l'impact de la quantification (2-6 bits) sur 8 LLMs évalués sur MMLU-Pro, CRUXEval et MuSR. Résultats : précision 8-bit (Q8_0) optimale, quantification agressive (Q2_K) acceptable mais avec pertes variables selon modèles/tâches. Modèles 7-9B offrent meilleur équilibre efficacité/performance.

Lire la source

Ton avis ?

Benchmarks Fine-tuning

Résumé généré par Claude — vérifié par l'humain

K-Quantization and its Impact on Output Performance

Autres angles sur ce sujet