arXiv cs.CL·26 mai 2026

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Signal

Hype

En 3 lignesSLAP est une méthode de sélection de données pour l'instruction tuning qui évalue la learnability au niveau des batches plutôt qu'individuellement. Via sampling stratifié et optimisation de distance relative, elle atteint les performances du dataset complet avec 20-40% moins de données sur LLaMA, ChatGLM et tâches variées (dialogue, traduction, QA).

Lire la source

Ton avis ?

Fine-tuning Llama Benchmarks

Résumé généré par Claude — vérifié par l'humain

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Autres angles sur ce sujet