Retour au feed
arXiv cs.AI·

Advancing Creative Physical Intelligence in Large Multimodal Models

Signal
75
Hype
25
En 3 lignesMM-CreativityBench, un nouveau benchmark, évalue la capacité des modèles multimodaux à résoudre des problèmes créatifs en identifiant des usages non-évidents d'objets dans des environnements physiquement contraints. Les LMMs actuels échouent par manque d'exploration ancrée et hallucinations. L'alignement par affordances via DPO réduit ces erreurs et améliore la sélection d'entités pertinentes.
Lire la source
Ton avis ?
BenchmarksVisionRaisonnementAlignement

Résumé généré par Claude — vérifié par l'humain