Retour au feed
arXiv cs.AI·

Latent Action Control for Reasoning-Guided Unified Image Generation

Signal
72
Hype
25
En 3 lignesLAC (Latent Action Control) rend le raisonnement actionnable dans les modèles génératifs unifiés en représentant la planification et le diagnostic comme des actions latentes continues. Intégré à BAGEL-7B-MoT, LAC améliore la génération compositionnelle et fondée sur les connaissances via alignement variationnel et GRPO, avec gains majeurs sur les relations spatiales et les liaisons d'attributs.
Lire la source
Ton avis ?
Génération d'imagesRaisonnementGénération de codePapers

Résumé généré par Claude — vérifié par l'humain