Faster physics in Python
OpenAI open-source une bibliothèque Python haute performance pour la simulation robotique basée sur le moteur MuJoCo, fruit d'un an de recherche en robotique.
4 articles
OpenAI open-source une bibliothèque Python haute performance pour la simulation robotique basée sur le moteur MuJoCo, fruit d'un an de recherche en robotique.
OpenAI et DeepMind développent un algorithme d'apprentissage par préférences humaines pour inférer les objectifs sans écrire explicitement de fonctions de récompense, réduisant les risques de comportements indésirables.
OpenAI explore les environnements multi-agents où les agents rivalisent pour des ressources comme étapes vers l'AGI. Ces environnements offrent un curriculum naturel (difficulté ajustée au niveau des concurrents) et pas d'équilibre stable, créant une pression constante à l'amélioration.
OpenAI présente une méthode d'exploration basée sur l'incertitude (UCB) utilisant des ensembles Q pour l'apprentissage par renforcement. La technique améliore l'exploration en estimant l'incertitude via plusieurs estimateurs Q, permettant une meilleure balance exploration-exploitation.