Retour au feed
arXiv cs.LG·

A Goal-Set Characterization of Task Composition in the Boolean Task Algebra

Signal
72
Hype
15
En 3 lignesLa Boolean Task Algebra (BTA) permet la composition de tâches zéro-shot en RL. Les auteurs montrent que dans les MDPs déterministes, les fonctions Q optimales se réduisent aux tâches universelle et vide, rendant les tâches de base logarithmiques redondantes. Ils proposent une méthode basée sur les ensembles de buts qui réduit les coûts d'apprentissage et de composition tout en préservant les performances.
Lire la source
Ton avis ?
Reinforcement learningRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain