arXiv cs.AI·20 mai 2026

Not all uncertainty is alike: volatility, stochasticity, and exploration

Signal

Hype

En 3 lignesArticle théorique sur l'exploration adaptative en environnements incertains. Distingue volatilité (drift des récompenses) et stochasticité (bruit d'observation) : la première augmente l'exploration optimale, la seconde la réduit. Propose CAUSE, bonus d'exploration en forme fermée via control-as-inference, validé sur bandits gaussiens avec dynamiques latentes.

Lire la source

Ton avis ?

Reinforcement learning Raisonnement Papers

Résumé généré par Claude — vérifié par l'humain

Not all uncertainty is alike: volatility, stochasticity, and exploration

Autres angles sur ce sujet