Retour au feed
arXiv cs.LG·

MAAT: Multi-phase Adapter-Aware Targeted Unlearning

Signal
78
Hype
15
En 3 lignes5WBENCH, un benchmark de 5 000 exemples équilibré par catégories 5W, révèle que les méthodes d'unlearning échouent sur les questions causales (Why). MAAT, un framework trois phases opérant sur poids LoRA, combine ascente de gradient projetée, élagage SVD et réparation KL pour atteindre simultanément oubli et rétention élevés sur connaissances causales.
Lire la source
Ton avis ?
Fine-tuningSécurité IAAlignementBenchmarksPapers

Résumé généré par Claude — vérifié par l'humain