Retour au feed
arXiv cs.LG·

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

Signal
72
Hype
18
En 3 lignesMéthode de normalisation d'observation personnalisée (PON) pour l'apprentissage par renforcement fédéré en environnements hétérogènes. Chaque agent normalise localement ses entrées d'état avec moyenne et variance mises à jour continuellement, évitant les problèmes d'agrégation de paramètres déséquilibrés. Tests sur tâches MuJoCo hétérogènes montrent accélération d'entraînement et performance supérieure.
Lire la source
Ton avis ?
Reinforcement learningMulti-agents

Résumé généré par Claude — vérifié par l'humain