Advancing Creative Physical Intelligence in Large Multimodal Models
Signal
75
Hype
25
En 3 lignesMM-CreativityBench, un nouveau benchmark, évalue la capacité des modèles multimodaux à résoudre des problèmes créatifs en identifiant des usages non-évidents d'objets dans des environnements physiquement contraints. Les LMMs actuels échouent par manque d'exploration ancrée et hallucinations. L'alignement par affordances via DPO réduit ces erreurs et améliore la sélection d'entités pertinentes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain