Retour au feed
arXiv cs.LG·

From Ticks to Flows: Dynamics of Neural Reinforcement Learning in Continuous Environments

Signal
72
Hype
15
En 3 lignesCadre théorique pour l'apprentissage par renforcement profond en environnements continus, modélisant le problème comme processus stochastique continu. Pour réseaux à une couche cachée, les auteurs caractérisent l'évolution de la distribution d'état via équations différentielles stochastiques à la limite de largeur infinie.
Lire la source
Ton avis ?
Reinforcement learningRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain