Retour au feed
arXiv cs.AI·

Baba in Wonderland: Online Self-Supervised Dynamics Discovery for Executable World Models

Signal
72
Hype
15
En 3 lignesAlice est un système d'apprentissage de modèles monde exécutables en ligne qui découvre les dynamiques d'environnement sans descriptions de règles ni signaux de récompense. L'agent induit les lois de transition par interaction seule, en traitant les conflits de préservation comme signal structurel pour raffiner les hypothèses. Évaluation sur Baba in Wonderland montre une amélioration substantielle.
Lire la source
Ton avis ?
RaisonnementReinforcement learningPapers

Résumé généré par Claude — vérifié par l'humain