Retour au feed
arXiv cs.LG·

TUBE: Tangent Upper Bound on Evidence for Discrete Diffusion Language Models

Signal
75
Hype
15
En 3 lignesTUBE est une borne supérieure variationnelle sur la log-vraisemblance pour les modèles de diffusion discrets. Contrairement aux ELBO existantes, TUBE admet un estimateur Monte Carlo sans biais et s'applique aux modèles de diffusion masqués, ARMs d'ordre quelconque et leurs variantes par blocs. Les expériences montrent que les modèles de diffusion restent strictement en dessous des ARMs en vraisemblance exacte.
Lire la source
Ton avis ?
PapersBenchmarksÉvaluations

Résumé généré par Claude — vérifié par l'humain