Unlearning Isn't Deletion: Investigating Reversibility of Machine Unlearning in LLMs
Signal
78
Hype
15
En 3 lignesÉtude montrant que l'oubli dans les LLM supprime l'information en surface seulement : un fine-tuning minimal restaure le comportement original. Framework d'analyse au niveau représentationnel (PCA, CKA, Fisher information) révèle quatre régimes d'oubli selon réversibilité et catastrophicité. Identifie cas d'oubli irréversible ciblé.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain