Learning a hierarchy
Signal
72
Hype
28
En 3 lignesOpenAI développe un algorithme d'apprentissage par renforcement hiérarchique qui apprend des actions haut niveau réutilisables. Appliqué à la navigation, l'agent découvre des primitives (marche, rampement) et résout rapidement des tâches nécessitant des milliers d'étapes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain