AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment
Signal
72
Hype
18
En 3 lignesAutoRubric-T2I est un framework qui synthétise automatiquement des rubrics explicites pour évaluer l'alignement texte-image via des juges Vision-Language Model. Utilisant <0.01% des données d'annotation requises par les modèles de récompense traditionnels, il surpasse les baselines sur MMRB2 et améliore la qualité de génération avec Flow-GRPO sur modèles de diffusion.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain