juillet 2018

5 articles

Learning dexterity

OpenAI a entraîné une main robotique humanoïde à manipuler des objets physiques avec une dextérité sans précédent, utilisant l'apprentissage par renforcement et la simulation.

Robotique Reinforcement learning

SIG

HYP

OpenAI Blog·26 juil.

Variational option discovery algorithms

OpenAI publie des algorithmes de découverte d'options variationnels pour l'apprentissage par renforcement. Ces méthodes permettent aux agents d'apprendre automatiquement des sous-tâches réutilisables sans supervision explicite, améliorant l'efficacité et la généralisation.

Reinforcement learning Papers OpenAI

SIG

HYP

OpenAI Blog·25 juil.

OpenAI Scholars 2018: Meet our Scholars

OpenAI lance son premier programme Scholars 2018, formant des développeurs logiciels expérimentés au machine learning. Le programme est désormais en cours et suivi publiquement.

OpenAI

SIG

HYP

OpenAI Blog·9 juil.

Glow: Better reversible generative models

OpenAI présente Glow, un modèle génératif réversible utilisant des convolutions 1×1 inversibles. Le modèle génère des images haute résolution, supporte l'échantillonnage efficace et découvre des features manipulables. Code et outil de visualisation en ligne disponibles.

OpenAI Génération d'images Papers

SIG

HYP

OpenAI Blog·4 juil.

Learning Montezuma’s Revenge from a single demonstration

OpenAI entraîne un agent à scorer 74 500 sur Montezuma's Revenge à partir d'une seule démonstration humaine, meilleur résultat publié. L'algorithme rejoue des séquences depuis des états clés de la démo et optimise le score via PPO.

Reinforcement learning Agents IA Benchmarks

SIG

HYP