Learning a hierarchy
OpenAI développe un algorithme d'apprentissage par renforcement hiérarchique qui apprend des actions haut niveau réutilisables. Appliqué à la navigation, l'agent découvre des primitives (marche, rampement) et résout rapidement des tâches nécessitant des milliers d'étapes.