novembre 2019

3 articles

Safety Gym

OpenAI publie Safety Gym, une suite d'environnements et d'outils pour mesurer les progrès des agents de reinforcement learning respectant les contraintes de sécurité pendant l'entraînement.

OpenAI Reinforcement learning Sécurité IA

SIG

HYP

OpenAI Blog·21 nov.

Benchmarking safe exploration in deep reinforcement learning

OpenAI publie un benchmark pour évaluer l'exploration sûre en apprentissage par renforcement profond. L'étude mesure la capacité des agents à explorer efficacement tout en respectant des contraintes de sécurité, critère clé pour les applications réelles.

OpenAI Reinforcement learning Sécurité IA

SIG

HYP

OpenAI Blog·5 nov.

GPT-2: 1.5B release

OpenAI publie la version 1.5B de GPT-2 avec code et poids du modèle, finalisant son plan de release progressif. L'objectif : tester un processus de publication responsable et fournir des outils de détection des outputs GPT-2.

GPT OpenAI Open source

SIG

HYP