Retour au feed
arXiv cs.AI·

Mind the Sim-to-Real Gap & Think Like a Scientist

Signal
72
Hype
15
En 3 lignesArticle théorique sur l'équilibre entre simulateurs pré-entraînés et expériences réelles en planification séquentielle. Décompose l'erreur du simulateur en décalage calibration-déploiement et résidu paramétrique. Propose Fisher-SEP, une politique expérimentale qui minimise la variance prédictive. Cas d'étude : chaîne logistique de distributeurs et dépistage du VIH.
Lire la source
Ton avis ?
Reinforcement learningRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain