Unlearning Isn't Deletion: Investigating Reversibility of Machine Unlearning in LLMs
Signal
78
Hype
15
En 3 lignesÉtude montrant que l'oubli dans les LLM supprime l'information en surface seulement : les modèles retrouvent leur comportement original via un fine-tuning minimal. Les auteurs proposent un cadre d'analyse au niveau représentationnel (PCA, CKA, Fisher information) pour évaluer la véritable suppression de données et identifient quatre régimes d'oubli selon réversibilité et catastrophicité.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain