arXiv cs.LG·1 juin 2026

MAAT: Multi-phase Adapter-Aware Targeted Unlearning

Signal

Hype

En 3 lignes5WBENCH, un benchmark de 5 000 exemples équilibré par catégories 5W, révèle que les méthodes d'unlearning échouent sur les questions causales (Why). MAAT, un framework trois phases opérant sur poids LoRA, combine ascente de gradient projetée, élagage SVD et réparation KL pour atteindre simultanément oubli et rétention élevés sur connaissances causales.

Lire la source

Ton avis ?

Fine-tuning Sécurité IA Alignement Benchmarks Papers

Résumé généré par Claude — vérifié par l'humain

MAAT: Multi-phase Adapter-Aware Targeted Unlearning

Autres angles sur ce sujet