Retour au feed
OpenAI Blog·

Learning complex goals with iterated amplification

Signal
65
Hype
25
En 3 lignesOpenAI propose l'amplification itérée, une technique de sécurité IA permettant de spécifier des comportements complexes en décomposant les tâches en sous-tâches, sans données labellisées ni fonction de récompense. Les expériences restent limitées à des domaines algorithmiques simples.
Lire la source
Ton avis ?
OpenAISécurité IAAlignementReinforcement learning

Résumé généré par Claude — vérifié par l'humain