Retour au feed
arXiv cs.AI·

MindZero: Learning Online Mental Reasoning With Zero Annotations

Signal
72
Hype
25
En 3 lignesMindZero est un framework d'apprentissage par renforcement auto-supervisé qui entraîne des modèles multimodaux (MLLMs) à inférer les états mentaux humains sans annotations. Le modèle est récompensé pour générer des hypothèses d'états mentaux maximisant la vraisemblance des actions observées. Après entraînement, l'inférence devient rapide et surpasse les méthodes basées sur des planificateurs.
Lire la source
Ton avis ?
RaisonnementReinforcement learningAgents IABenchmarks

Résumé généré par Claude — vérifié par l'humain