Retour au feed
arXiv cs.LG·

Dominant-Layer ZO: A Single Layer Dominates Zeroth-Order Fine-Tuning of LLMs

Signal
82
Hype
15
En 3 lignesUne étude révèle qu'en optimisation zeroth-order (ZO) pour fine-tuner les LLM, une seule couche de décodage domine l'adaptation. Fine-tuner cette couche dominante seule égale ou surpasse le fine-tuning ZO complet sur LLaMA2-7B et Qwen3-8B, avec accélération jusqu'à 4.52×. La couche dominante est identifiable avant entraînement via analyse des outliers d'activation.
Lire la source
Ton avis ?
Fine-tuningRaisonnementBenchmarksLlama

Résumé généré par Claude — vérifié par l'humain