Retour au feed
OpenAI Blog·

Gathering human feedback

Signal
75
Hype
20
En 3 lignesOpenAI publie RL-Teacher, une implémentation open-source pour entraîner des IA via retours humains occasionnels plutôt que des fonctions de récompense prédéfinies. La technique vise à développer des systèmes IA sûrs et s'applique aux problèmes de reinforcement learning où les récompenses sont difficiles à spécifier.
Lire la source
Ton avis ?
OpenAIReinforcement learningSécurité IAOpen source

Résumé généré par Claude — vérifié par l'humain