Evolution strategies as a scalable alternative to reinforcement learning
OpenAI montre que les stratégies évolutionnaires (ES) rivalisent avec l'apprentissage par renforcement standard sur des benchmarks modernes (Atari, MuJoCo) tout en évitant plusieurs inconvénients de l'RL.