arXiv cs.AI·19 mai 2026

AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment

Signal

Hype

En 3 lignesAutoRubric-T2I est un framework qui synthétise automatiquement des rubrics explicites pour évaluer l'alignement texte-image via des juges Vision-Language Model. Utilisant <0.01% des données d'annotation requises par les modèles de récompense traditionnels, il surpasse les baselines sur MMRB2 et améliore la qualité de génération avec Flow-GRPO sur modèles de diffusion.

Lire la source

Ton avis ?

Génération d'images Vision Évaluations Reinforcement learning Papers

Résumé généré par Claude — vérifié par l'humain

AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment

Autres angles sur ce sujet