Retour au feed
arXiv cs.LG·

Metric-Gradient Projection for Stable Multi-Agent Policy Learning

Signal
72
Hype
15
En 3 lignesHPML (Hodge-Projected Multi-agent Learning) stabilise l'apprentissage multi-agent en projetant le champ de mise à jour conjointe sur une composante métrique-gradient. La méthode utilise une projection de type Hodge dans un espace L² de champs vectoriels, implémentée via réalisations basées graphes et réseaux de neurones amortis. Résultats : stabilité améliorée et rendements normalisés supérieurs sur benchmarks CTDE.
Lire la source
Ton avis ?
Multi-agentsReinforcement learningPapers

Résumé généré par Claude — vérifié par l'humain