Retour au feed
arXiv cs.LG·

Position: Deployed Reinforcement Learning should be Continual

Signal
65
Hype
25
En 3 lignesPosition paper argumentant que les systèmes RL déployés doivent adopter l'apprentissage continu plutôt que le paradigme train-then-fix. Les auteurs identifient quatre sources de non-stationnarité post-déploiement nécessitant un apprentissage sans fin et analysent des exemples réels de RL continu.
Lire la source
Ton avis ?
Reinforcement learningPapers

Résumé généré par Claude — vérifié par l'humain