Spinning Up in Deep RL: Workshop review
OpenAI a organisé le 2 février son premier atelier « Spinning Up in Deep RL » dans le cadre d'une nouvelle initiative éducative. L'événement vise à former aux fondamentaux du reinforcement learning profond.
4 articles
OpenAI a organisé le 2 février son premier atelier « Spinning Up in Deep RL » dans le cadre d'une nouvelle initiative éducative. L'événement vise à former aux fondamentaux du reinforcement learning profond.
OpenAI publie un paper argumentant que la sécurité IA long-terme nécessite des chercheurs en sciences sociales pour assurer l'alignement avec les valeurs humaines. L'entreprise prévoit d'embaucher des scientifiques sociaux à temps plein.
OpenAI a entraîné un grand modèle de langage non supervisé générant des paragraphes cohérents, atteignant l'état de l'art sur plusieurs benchmarks et accomplissant lecture compréhension, traduction, QA et résumé sans entraînement spécifique aux tâches.
OpenAI publie une recherche sur les limites computationnelles de la classification robuste face aux adversaires. L'étude démontre des trade-offs fondamentaux : améliorer la robustesse augmente les coûts de calcul, sans garantie de performance. Implications pour la sécurité des modèles IA.