Learning dexterity
OpenAI a entraîné une main robotique humanoïde à manipuler des objets physiques avec une dextérité sans précédent, utilisant l'apprentissage par renforcement et la simulation.
5 articles
OpenAI a entraîné une main robotique humanoïde à manipuler des objets physiques avec une dextérité sans précédent, utilisant l'apprentissage par renforcement et la simulation.
OpenAI publie des algorithmes de découverte d'options variationnels pour l'apprentissage par renforcement. Ces méthodes permettent aux agents d'apprendre automatiquement des sous-tâches réutilisables sans supervision explicite, améliorant l'efficacité et la généralisation.
OpenAI lance son premier programme Scholars 2018, formant des développeurs logiciels expérimentés au machine learning. Le programme est désormais en cours et suivi publiquement.
OpenAI présente Glow, un modèle génératif réversible utilisant des convolutions 1×1 inversibles. Le modèle génère des images haute résolution, supporte l'échantillonnage efficace et découvre des features manipulables. Code et outil de visualisation en ligne disponibles.
OpenAI entraîne un agent à scorer 74 500 sur Montezuma's Revenge à partir d'une seule démonstration humaine, meilleur résultat publié. L'algorithme rejoue des séquences depuis des états clés de la démo et optimise le score via PPO.