arXiv cs.LG·2 June 2026

Adaptive Order Policies for Masked Diffusion

Signal

Hype

In three linesMasked diffusion models: a lightweight policy network learns optimal token unmasking order. Loss reweighting by denoiser probabilities. Outperforms heuristics on order-sensitive tasks like combinatorics and proteins.

Read source

Your take?

Papers Reasoning Benchmarks

Summary generated by Claude — human-verified

Adaptive Order Policies for Masked Diffusion

Other angles on this story