avril 2017

4 articles

Equivalence between policy gradients and soft Q-learning

OpenAI démontre l'équivalence mathématique entre les méthodes de policy gradients et le soft Q-learning en apprentissage par renforcement. Cette découverte théorique unifie deux approches majeures de l'RL et ouvre des perspectives pour combiner leurs avantages respectifs.

Reinforcement learning Papers

SIG

HYP

OpenAI Blog·10 avr.

Stochastic Neural Networks for hierarchical reinforcement learning

OpenAI publie une recherche sur les réseaux de neurones stochastiques appliqués à l'apprentissage par renforcement hiérarchique. La méthode améliore la capacité des agents à décomposer des tâches complexes en sous-objectifs.

OpenAI Reinforcement learning Papers

SIG

HYP

OpenAI Blog·6 avr.

Unsupervised sentiment neuron

OpenAI a développé un système non supervisé qui apprend une excellente représentation du sentiment en étant entraîné uniquement à prédire le caractère suivant dans des avis Amazon.

OpenAI Raisonnement Embeddings

SIG

HYP

OpenAI Blog·1 avr.

Spam detection in the physical world

OpenAI a développé un système de détection de spam entraîné entièrement en simulation et déployé sur un robot physique. Première application d'IA de ce type capable de fonctionner dans le monde réel.

OpenAI Robotique Reinforcement learning

SIG

HYP