Safety Gym
OpenAI publie Safety Gym, une suite d'environnements et d'outils pour mesurer les progrès des agents de reinforcement learning respectant les contraintes de sécurité pendant l'entraînement.
3 articles
OpenAI publie Safety Gym, une suite d'environnements et d'outils pour mesurer les progrès des agents de reinforcement learning respectant les contraintes de sécurité pendant l'entraînement.
OpenAI publie un benchmark pour évaluer l'exploration sûre en apprentissage par renforcement profond. L'étude mesure la capacité des agents à explorer efficacement tout en respectant des contraintes de sécurité, critère clé pour les applications réelles.
OpenAI publie la version 1.5B de GPT-2 avec code et poids du modèle, finalisant son plan de release progressif. L'objectif : tester un processus de publication responsable et fournir des outils de détection des outputs GPT-2.