Retour au feed
arXiv cs.LG·

Adaptive Order Policies for Masked Diffusion

Signal
72
Hype
15
En 3 lignesModèles de diffusion masquée : une politique réseau apprend l'ordre optimal de démasquage des tokens. Approche par réépondération de la perte selon les probabilités du débruiteur. Surpasse les heuristiques sur tâches combinatoires et protéines.
Lire la source
Ton avis ?
PapersRaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain