Retour au feed
arXiv cs.AI·

LEAP: Learnable End-to-End Adaptive Pruning of Large Language Models

Signal
78
Hype
15
En 3 lignesLEAP propose une méthode d'élagage non-structuré end-to-end pour LLM utilisant une relaxation Bernoulli-Gumbel-sigmoid par poids. Sur cinq familles de modèles (0.5B–8B) à 50–60% de sparsité, LEAP améliore la précision zero-shot de +2.59 points en moyenne vs ADMM.
Lire la source
Ton avis ?
Fine-tuningBenchmarksPapers

Résumé généré par Claude — vérifié par l'humain