avril 2018

3 articles

Evolved Policy Gradients

OpenAI publie Evolved Policy Gradients (EPG), une approche de méta-apprentissage qui évolue la fonction de perte des agents d'apprentissage. Les agents EPG généralisent à des tâches nouvelles non vues en entraînement, comme naviguer vers un objet placé d'un côté différent de la pièce.

OpenAI Reinforcement learning Raisonnement

SIG

HYP

OpenAI Blog·10 avr.

Gotta Learn Fast: A new benchmark for generalization in RL

OpenAI présente un nouveau benchmark pour évaluer la généralisation en apprentissage par renforcement. L'outil mesure la capacité des agents RL à s'adapter à des environnements nouveaux et variés, au-delà de leurs données d'entraînement.

Reinforcement learning Benchmarks OpenAI

SIG

HYP

OpenAI Blog·5 avr.

Retro Contest

OpenAI lance un concours de transfer learning mesurant la capacité d'un algorithme de reinforcement learning à généraliser à partir d'expériences antérieures.

Reinforcement learning Benchmarks OpenAI

SIG

HYP