Prefix-Adaptive Block Diffusion for Efficient Document Recognition
Signal
72
Hype
18
En 3 lignesPA-BDM améliore les Block Diffusion Models pour la reconnaissance documentaire en remplaçant le débruitage bidirectionnel par un débruitage causal préfixe-suffixe. Avec perte structurelle contrôlée par confiance et engagement progressif du préfixe, le modèle 3B atteint +71,6% de débit inférence vs MinerU-Diffusion 2.5B.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain