Q4_K_M is fine for chat and a trap for agents. Here is math mathing.
Signal
65
Hype
25
En 3 lignesQ4_K_M quantization convient au chat mais pose problème pour les agents autonomes. À 3% d'erreurs par appel, une boucle de 30 étapes atteint 40% de succès (vs 91% en Q6). Les erreurs silencieuses (format valide, contenu incorrect) se propagent en aval sans détection inline.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain