OpenAI Blog·22 octobre 2018

Learning complex goals with iterated amplification

Signal

Hype

En 3 lignesOpenAI propose l'amplification itérée, une technique de sécurité IA permettant de spécifier des comportements complexes en décomposant les tâches en sous-tâches, sans données labellisées ni fonction de récompense. Les expériences restent limitées à des domaines algorithmiques simples.

Lire la source

Ton avis ?

OpenAI Sécurité IA Alignement Reinforcement learning

Résumé généré par Claude — vérifié par l'humain

Learning complex goals with iterated amplification

Autres angles sur ce sujet