Metric-Gradient Projection for Stable Multi-Agent Policy Learning
Signal
72
Hype
15
En 3 lignesHPML (Hodge-Projected Multi-agent Learning) stabilise l'apprentissage multi-agent en projetant le champ de mise à jour conjointe sur une composante métrique-gradient. La méthode utilise une projection de type Hodge dans un espace L² de champs vectoriels, implémentée via réalisations basées graphes et réseaux de neurones amortis. Résultats : stabilité améliorée et rendements normalisés supérieurs sur benchmarks CTDE.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain