arXiv cs.AI·19 mai 2026

Tracking Drift: Variation-Aware Entropy Scheduling for Non-Stationary Reinforcement Learning

Signal

Hype

En 3 lignesMéthode AES (Adaptive Entropy Scheduling) pour ajuster dynamiquement le coefficient d'entropie en RL non-stationnaire face à la dérive environnementale. Propose une règle d'échelle en racine carrée basée sur un proxy de non-stationnarité observable. Évaluation sur 4 variantes d'algorithmes, 12 tâches, 4 modes de dérive : réduit la dégradation de performance et accélère la récupération après changements abruptes.

Lire la source

Ton avis ?

Reinforcement learning Raisonnement

Résumé généré par Claude — vérifié par l'humain

Tracking Drift: Variation-Aware Entropy Scheduling for Non-Stationary Reinforcement Learning

Autres angles sur ce sujet