Heterogeneous Information-Bottleneck Coordination Graphs for Multi-Agent Reinforcement Learning
Signal
75
Hype
15
En 3 lignesHIBCG propose une méthode théorique pour apprendre des graphes de coordination creux en apprentissage multi-agent. Via l'information bottleneck, elle détermine quelles arêtes exister et leur capacité de message, avec garanties formelles sur la topologie apprise et allocation différenciée par groupe d'agents.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain