Retour au feed
arXiv cs.LG·

Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?

Signal
78
Hype
18
En 3 lignesÉtude comparative RL vs SFT sur Qwen2.5-3B-Instruct : le renforcement par RL préserve mieux les circuits internes du modèle de base que l'ajustement supervisé (SFT), qui adapte plus vite mais détruit davantage les capacités antérieures. Métrique proposée : vulnérabilité différentielle des circuits au niveau des têtes d'attention.
Lire la source
Ton avis ?
Reinforcement learningFine-tuningPapers

Résumé généré par Claude — vérifié par l'humain