octobre 2017

7 articles

Learning a hierarchy

OpenAI développe un algorithme d'apprentissage par renforcement hiérarchique qui apprend des actions haut niveau réutilisables. Appliqué à la navigation, l'agent découvre des primitives (marche, rampement) et résout rapidement des tâches nécessitant des milliers d'étapes.

Reinforcement learning Raisonnement OpenAI

SIG

HYP

OpenAI Blog·19 oct.

Generalizing from simulation

OpenAI présente des techniques de robotique permettant aux contrôleurs de robots, entraînés entièrement en simulation, de s'adapter aux changements environnementaux non prévus lors du déploiement physique. Passage de systèmes en boucle ouverte à des systèmes en boucle fermée.

Robotique Reinforcement learning

SIG

HYP

OpenAI Blog·18 oct.

Sim-to-real transfer of robotic control with dynamics randomization

OpenAI démontre le transfert sim-to-real de contrôle robotique via randomisation de dynamiques. Un robot entraîné en simulation avec variations de paramètres physiques (friction, masse, délais) réussit des tâches complexes sur du matériel réel sans ajustement supplémentaire.

Robotique Reinforcement learning Papers

SIG

HYP

OpenAI Blog·18 oct.

Asymmetric actor critic for image-based robot learning

OpenAI publie une méthode d'apprentissage par renforcement asymétrique pour la robotique : un acteur léger s'exécute sur le robot tandis qu'un critique lourd s'entraîne hors ligne. Approche testée sur des tâches de manipulation d'objets.

Robotique Reinforcement learning Papers

SIG

HYP

OpenAI Blog·17 oct.

Domain randomization and generative models for robotic grasping

OpenAI combine la randomisation de domaine et les modèles génératifs pour améliorer la préhension robotique. L'approche entraîne des modèles sur des données synthétiques variées, puis les transfère sur des robots réels sans ajustement supplémentaire.

Robotique Vision Open source

SIG

HYP

OpenAI Blog·11 oct.

Meta-learning for wrestling

OpenAI démontre qu'un agent de meta-learning peut apprendre rapidement à vaincre un adversaire plus fort sans meta-learning dans une simulation de lutte robotique, et s'adapter à des dysfonctionnements physiques.

Reinforcement learning Robotique Papers

SIG

HYP

OpenAI Blog·11 oct.

Competitive self-play

OpenAI démontre que l'auto-jeu (self-play) permet aux IA de découvrir des compétences physiques complexes (tacle, esquive, feinte, tir, réception) sans conception explicite. L'environnement s'adapte automatiquement à la difficulté optimale. Résultats reproduits sur Dota 2.

Reinforcement learning Agents IA Benchmarks

SIG

HYP