arXiv cs.LG·2 juin 2026

Adaptive Order Policies for Masked Diffusion

Signal

Hype

En 3 lignesModèles de diffusion masquée : une politique réseau apprend l'ordre optimal de démasquage des tokens. Approche par réépondération de la perte selon les probabilités du débruiteur. Surpasse les heuristiques sur tâches combinatoires et protéines.

Lire la source

Ton avis ?

Papers Raisonnement Benchmarks

Résumé généré par Claude — vérifié par l'humain

Adaptive Order Policies for Masked Diffusion

Autres angles sur ce sujet