TUBE: Tangent Upper Bound on Evidence for Discrete Diffusion Language Models
Signal
75
Hype
15
En 3 lignesTUBE est une borne supérieure variationnelle sur la log-vraisemblance pour les modèles de diffusion discrets. Contrairement aux ELBO existantes, TUBE admet un estimateur Monte Carlo sans biais et s'applique aux modèles de diffusion masqués, ARMs d'ordre quelconque et leurs variantes par blocs. Les expériences montrent que les modèles de diffusion restent strictement en dessous des ARMs en vraisemblance exacte.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain