OpenAI Blog·5 novembre 2018

Plan online, learn offline: Efficient learning and exploration via model-based control

Signal

Hype

En 3 lignesOpenAI publie une recherche sur le contrôle basé modèle combinant planification en ligne et apprentissage hors ligne. La méthode améliore l'efficacité de l'exploration et de l'apprentissage par renforcement en utilisant des modèles prédictifs pour guider les décisions.

Lire la source

Ton avis ?

Reinforcement learning Raisonnement Papers

Résumé généré par Claude — vérifié par l'humain

Plan online, learn offline: Efficient learning and exploration via model-based control

Autres angles sur ce sujet