Retour au feed
OpenAI Blog·

Learning to model other minds

Signal
72
Hype
35
En 3 lignesOpenAI publie LOLA (Learning with Opponent-Learning Awareness), un algorithme qui modélise l'apprentissage d'autres agents et découvre des stratégies collaboratives comme le tit-for-tat dans le dilemme du prisonnier itéré.
Lire la source
Ton avis ?
OpenAIMulti-agentsReinforcement learningRaisonnement

Résumé généré par Claude — vérifié par l'humain