OpenAI Blog·3 août 2017

Gathering human feedback

Signal

Hype

En 3 lignesOpenAI publie RL-Teacher, une implémentation open-source pour entraîner des IA via retours humains occasionnels plutôt que des fonctions de récompense prédéfinies. La technique vise à développer des systèmes IA sûrs et s'applique aux problèmes de reinforcement learning où les récompenses sont difficiles à spécifier.

Lire la source

Ton avis ?

OpenAI Reinforcement learning Sécurité IA Open source

Résumé généré par Claude — vérifié par l'humain

Gathering human feedback

Autres angles sur ce sujet