Machine Unlearning for Masked Diffusion Language Models
Signal
75
Hype
15
En 3 lignesPremiers travaux sur l'oubli machine pour modèles de diffusion masqués (LLaDA, Dream). MDU minimise la divergence KL entre prédictions conditionnelles et distribution inconditionnelle masquée, avec paramètre de température pour équilibrer confidentialité-utilité. Code disponible.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain