A Goal-Set Characterization of Task Composition in the Boolean Task Algebra
Signal
72
Hype
15
En 3 lignesLa Boolean Task Algebra (BTA) permet la composition de tâches zéro-shot en RL. Les auteurs montrent que dans les MDPs déterministes, les fonctions Q optimales se réduisent aux tâches universelle et vide, rendant les tâches de base logarithmiques redondantes. Ils proposent une méthode basée sur les ensembles de buts qui réduit les coûts d'apprentissage et de composition tout en préservant les performances.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain