Retour au feed
arXiv cs.CL·

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Signal
72
Hype
28
En 3 lignesSLAP est une méthode de sélection de données pour l'instruction tuning qui évalue la learnability au niveau des batches plutôt qu'individuellement. Via sampling stratifié et optimisation de distance relative, elle atteint les performances du dataset complet avec 20-40% moins de données sur LLaMA, ChatGLM et tâches variées (dialogue, traduction, QA).
Lire la source
Ton avis ?
Fine-tuningLlamaBenchmarks

Résumé généré par Claude — vérifié par l'humain