October 2017

7 articles

Learning a hierarchy

OpenAI develops a hierarchical reinforcement learning algorithm that learns reusable high-level actions. Applied to navigation, the agent discovers primitives (walking, crawling) and rapidly solves tasks requiring thousands of timesteps.

Reinforcement learning Reasoning OpenAI

SIG

HYP

OpenAI Blog·Oct 19

Generalizing from simulation

OpenAI presents robotics techniques enabling robot controllers trained entirely in simulation to adapt to unexpected environmental changes during physical deployment. Shift from open-loop to closed-loop systems.

Robotics Reinforcement learning

SIG

HYP

OpenAI Blog·Oct 18

Sim-to-real transfer of robotic control with dynamics randomization

OpenAI demonstrates sim-to-real transfer of robotic control using dynamics randomization. A robot trained in simulation with varied physical parameters (friction, mass, latency) successfully performs complex tasks on real hardware without additional tuning.

Robotics Reinforcement learning Papers

SIG

HYP

OpenAI Blog·Oct 18

Asymmetric actor critic for image-based robot learning

OpenAI releases an asymmetric actor-critic method for robot learning: a lightweight actor runs on-robot while a heavy critic trains offline. Approach tested on object manipulation tasks.

Robotics Reinforcement learning Papers

SIG

HYP

OpenAI Blog·Oct 17

Domain randomization and generative models for robotic grasping

OpenAI combines domain randomization and generative models to improve robotic grasping. The approach trains models on varied synthetic data, then transfers them to real robots without additional fine-tuning.

Robotics Vision Open source

SIG

HYP

OpenAI Blog·Oct 11

Meta-learning for wrestling

OpenAI demonstrates that a meta-learning agent can quickly learn to defeat a stronger non-meta-learning opponent in simulated robot wrestling and adapt to physical malfunctions.

Reinforcement learning Robotics Papers

SIG

HYP

OpenAI Blog·Oct 11

Competitive self-play

OpenAI shows self-play enables AIs to discover complex physical skills (tackling, ducking, faking, kicking, catching) without explicit environment design. The environment automatically adapts to optimal difficulty. Results replicated on Dota 2.

Reinforcement learning AI Agents Benchmarks

SIG

HYP