Any idea why prunning can improve perplexity?
Signal
35
Hype
25
En 3 lignesUn utilisateur de r/LocalLLaMA rapporte une expérience combinant pruning WANDA avec quantisation sans données (HQQ). Le pruning avant quantisation améliore la perplexité dans cette configuration spécifique. L'auteur cherche des explications et des retours sur ce résultat de recherche préliminaire.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain