mars 2018

7 articles

Variance reduction for policy gradient with action-dependent factorized baselines

OpenAI publie une méthode de réduction de variance pour les algorithmes de gradient de politique utilisant des baselines factorisées dépendantes des actions. La technique améliore l'efficacité d'entraînement en réduisant la variance des estimateurs de gradient, applicable aux modèles de renforcement par apprentissage.

Reinforcement learning OpenAI Papers

SIG

HYP

OpenAI Blog·15 mars

Improving GANs using optimal transport

OpenAI publie une méthode pour améliorer les GANs via le transport optimal. La technique réduit l'instabilité d'entraînement et améliore la qualité des images générées en utilisant des distances de Wasserstein.

Génération d'images Papers OpenAI

SIG

HYP

OpenAI Blog·15 mars

Report from the OpenAI hackathon

OpenAI a organisé son premier hackathon le 3 mars avec 100 membres de la communauté IA. L'événement a rassemblé des développeurs et chercheurs autour de projets utilisant les technologies OpenAI.

OpenAI

SIG

HYP

OpenAI Blog·8 mars

On first-order meta-learning algorithms

OpenAI publie une analyse sur les algorithmes de méta-apprentissage du premier ordre. L'article explore les fondements théoriques et pratiques de ces méthodes d'optimisation qui permettent aux modèles d'apprendre à apprendre rapidement avec peu d'exemples.

OpenAI Papers Reinforcement learning

SIG

HYP

OpenAI Blog·7 mars

Reptile: A scalable meta-learning algorithm

OpenAI présente Reptile, un algorithme de meta-learning scalable qui échantillonne des tâches, applique la descente de gradient stochastique et met à jour les paramètres initiaux. Mathématiquement similaire à MAML du premier ordre, il ne nécessite qu'un accès boîte noire à un optimiseur comme SGD ou Adam.

OpenAI Reinforcement learning

SIG

HYP

OpenAI Blog·6 mars

OpenAI Scholars

OpenAI lance un programme de bourses pour 6–10 personnes issues de groupes sous-représentés. Les bénéficiaires étudieront le deep learning à temps plein pendant 3 mois et publieront un projet open-source.

OpenAI Open source Business

SIG

HYP

OpenAI Blog·3 mars

Some considerations on learning to explore via meta-reinforcement learning

OpenAI explore l'apprentissage par renforcement méta (meta-RL) pour améliorer la capacité des agents à explorer efficacement. L'article examine comment les modèles peuvent apprendre des stratégies d'exploration généralisables plutôt que d'être pré-programmés.

Reinforcement learning Agents IA OpenAI

SIG

HYP