Retour au feed
arXiv cs.AI·

AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment

Signal
72
Hype
18
En 3 lignesAutoRubric-T2I est un framework qui synthétise automatiquement des rubrics explicites pour évaluer l'alignement texte-image via des juges Vision-Language Model. Utilisant <0.01% des données d'annotation requises par les modèles de récompense traditionnels, il surpasse les baselines sur MMRB2 et améliore la qualité de génération avec Flow-GRPO sur modèles de diffusion.
Lire la source
Ton avis ?
Génération d'imagesVisionÉvaluationsReinforcement learningPapers

Résumé généré par Claude — vérifié par l'humain