LLM-Guided Communication for Cooperative Multi-Agent Reinforcement Learning
LMAC utilise un LLM pour concevoir des protocoles de communication dans le MARL, permettant aux agents de reconstruire l'état global de manière uniforme. L'approche affine itérativement le protocole via un critère de conscience d'état explicite. Tests sur benchmarks MARL montrent gains de performance substantiels.