Retour au feed
arXiv cs.LG·

From Parameters to Data: A Task-Parameter-Guided Fine-Tuning Pipeline for Efficient LLM Alignment

Signal
78
Hype
25
En 3 lignesP2D, un framework d'alignement LLM, couple sélection de données et fine-tuning efficace en paramètres. En identifiant les têtes d'attention critiques pour chaque tâche, P2D mine des données pertinentes et élaguer 90% des paramètres. Résultat : +8.3pp de performance et 7.0x d'accélération avec seulement 10% des données et 10% des têtes.
Lire la source
Ton avis ?
Fine-tuningRaisonnementAlignementPapers

Résumé généré par Claude — vérifié par l'humain