Retour au feed
OpenAI Blog·

Learning a hierarchy

Signal
72
Hype
28
En 3 lignesOpenAI développe un algorithme d'apprentissage par renforcement hiérarchique qui apprend des actions haut niveau réutilisables. Appliqué à la navigation, l'agent découvre des primitives (marche, rampement) et résout rapidement des tâches nécessitant des milliers d'étapes.
Lire la source
Ton avis ?
Reinforcement learningRaisonnementOpenAI

Résumé généré par Claude — vérifié par l'humain