arXiv cs.AI·19 mai 2026

LEAP: Learnable End-to-End Adaptive Pruning of Large Language Models

Signal

Hype

En 3 lignesLEAP propose une méthode d'élagage non-structuré end-to-end pour LLM utilisant une relaxation Bernoulli-Gumbel-sigmoid par poids. Sur cinq familles de modèles (0.5B–8B) à 50–60% de sparsité, LEAP améliore la précision zero-shot de +2.59 points en moyenne vs ADMM.

Lire la source

Ton avis ?

Fine-tuning Benchmarks Papers

Résumé généré par Claude — vérifié par l'humain

LEAP: Learnable End-to-End Adaptive Pruning of Large Language Models

Autres angles sur ce sujet