arXiv cs.LG·28 mai 2026

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

Signal

Hype

En 3 lignesMéthode de normalisation d'observation personnalisée (PON) pour l'apprentissage par renforcement fédéré en environnements hétérogènes. Chaque agent normalise localement ses entrées d'état avec moyenne et variance mises à jour continuellement, évitant les problèmes d'agrégation de paramètres déséquilibrés. Tests sur tâches MuJoCo hétérogènes montrent accélération d'entraînement et performance supérieure.

Lire la source

Ton avis ?

Reinforcement learning Multi-agents

Résumé généré par Claude — vérifié par l'humain

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

Autres angles sur ce sujet