Retour au feed
arXiv cs.LG·

DualOptim+: Bridging Shared and Decoupled Optimizer States for Better Machine Unlearning in Large Language Models

Signal
72
Hype
18
En 3 lignesDualOptim+ est un framework d'optimisation pour l'oubli machine dans les LLM. Il utilise des états de base partagés et des états delta découplés pour équilibrer les objectifs d'oubli et de rétention. Une variante 8bit réduit la mémoire. Tests sur l'oubli fictif/réel, l'alignement de sécurité et l'apprentissage multi-tâche.
Lire la source
Ton avis ?
Fine-tuningSécurité IAAlignementPapers

Résumé généré par Claude — vérifié par l'humain