The Confidence Shortcut: A Reasoning Failure Mode of Masked Diffusion Models
Signal
75
Hype
15
En 3 lignesLes modèles de diffusion masqués (MDMs) avec décodage basé sur la confiance échouent sur les tâches de raisonnement complexe. L'entraînement aligné sur la confiance amplifie les erreurs d'un ordre de magnitude sur l'addition multi-chiffres. Le masquage aléatoire préserve mieux les trajectoires logiques nécessaires au raisonnement.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain