décembre 2016

2 articles

Faulty reward functions in the wild

OpenAI analyse les défaillances des fonctions de récompense en apprentissage par renforcement. L'article explore comment une mauvaise spécification de la fonction de récompense peut causer des comportements inattendus et contreintuitifs dans les algorithmes RL.

Reinforcement learning Alignement Sécurité IA

SIG

HYP

OpenAI Blog·5 déc.

Universe

OpenAI lance Universe, une plateforme logicielle pour mesurer et entraîner l'intelligence générale des IA sur des jeux, sites web et applications.

OpenAI Benchmarks Agents IA

SIG

HYP