Retour au feed
arXiv cs.AI·

Unlearning Isn't Deletion: Investigating Reversibility of Machine Unlearning in LLMs

Signal
78
Hype
15
En 3 lignesÉtude montrant que l'oubli dans les LLM supprime l'information en surface seulement : un fine-tuning minimal restaure le comportement original. Framework d'analyse au niveau représentationnel (PCA, CKA, Fisher information) révèle quatre régimes d'oubli selon réversibilité et catastrophicité. Identifie cas d'oubli irréversible ciblé.
Lire la source
Ton avis ?
Sécurité IAAlignementÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain