arXiv cs.LG·27 mai 2026

Balancing Plasticity and Stability with Fast and Slow Successor Features

Signal

Hype

En 3 lignesÉtude sur l'adaptation des agents RL en environnements non-stationnaires graduels. Les auteurs modifient des environnements 3D Miniworld et MuJoCo pour introduire une dérive continue, et montrent que la consolidation synaptique appliquée aux Successor Features (SFs) multi-échelles surpasse les approches basées sur les Q-values. La stabilité prime sur la plasticité dans l'apprentissage continu.

Lire la source

Ton avis ?

Reinforcement learning Papers Benchmarks

Résumé généré par Claude — vérifié par l'humain

Balancing Plasticity and Stability with Fast and Slow Successor Features

Autres angles sur ce sujet