Retour au feed
arXiv cs.LG·

Catching a Moving Subspace: Low-Rank Bandits Beyond Stationarity

Signal
72
Hype
15
En 3 lignesArticle théorique sur les bandits contextuels linéaires de faible rang avec dérive de sous-espace. Propose SPSC, un algorithme qui combine sondes isotropes et ridge-UCB projeté, atteignant une regret dynamique de Õ(r√T) au lieu de Õ(d√T). Caractérise les conditions d'identifiabilité du sous-espace mouvant et valide sur 11 benchmarks (synthétiques, MovieLens, données cliniques, ZOZOTOWN).
Lire la source
Ton avis ?
Reinforcement learningPapersBenchmarks

Résumé généré par Claude — vérifié par l'humain