Retour au feed
arXiv cs.AI·

Tracking Drift: Variation-Aware Entropy Scheduling for Non-Stationary Reinforcement Learning

Signal
72
Hype
18
En 3 lignesMéthode AES (Adaptive Entropy Scheduling) pour ajuster dynamiquement le coefficient d'entropie en RL non-stationnaire face à la dérive environnementale. Propose une règle d'échelle en racine carrée basée sur un proxy de non-stationnarité observable. Évaluation sur 4 variantes d'algorithmes, 12 tâches, 4 modes de dérive : réduit la dégradation de performance et accélère la récupération après changements abruptes.
Lire la source
Ton avis ?
Reinforcement learningRaisonnement

Résumé généré par Claude — vérifié par l'humain