arXiv cs.LG·20 mai 2026

Metric-Gradient Projection for Stable Multi-Agent Policy Learning

Signal

Hype

En 3 lignesHPML (Hodge-Projected Multi-agent Learning) stabilise l'apprentissage multi-agent en projetant le champ de mise à jour conjointe sur une composante métrique-gradient. La méthode utilise une projection de type Hodge dans un espace L² de champs vectoriels, implémentée via réalisations basées graphes et réseaux de neurones amortis. Résultats : stabilité améliorée et rendements normalisés supérieurs sur benchmarks CTDE.

Lire la source

Ton avis ?

Multi-agents Reinforcement learning Papers

Résumé généré par Claude — vérifié par l'humain

Metric-Gradient Projection for Stable Multi-Agent Policy Learning

Autres angles sur ce sujet