arXiv cs.AI·19 May 2026

Membership Inference Attacks on Discrete Diffusion Language Models

Signal

Hype

In three linesStudy of membership inference attacks (MIA) on masked diffusion language models (MDLM). Researchers extract 46-dimensional feature vectors from reconstruction loss at different masking ratios and train XGBoost and MLP classifiers. On MIMIR benchmark, XGBoost achieves AUC 0.878 (peak 0.930), outperforming SAMA baseline by 0.062 AUC. ELBO trajectory alone drives most of the signal.

Read source

Your take?

AI safety Benchmarks Papers

Summary generated by Claude — human-verified

Membership Inference Attacks on Discrete Diffusion Language Models

Other angles on this story