Retour au feed
arXiv cs.LG·

Transferable Reinforcement Learning via Probabilistic Latent Embeddings and Dynamic Policy Adaptation for Sim-to-Real Deployment

Signal
72
Hype
18
En 3 lignesFramework RL pour transfert de politique sim-to-real via embeddings latents probabilistes et adaptation dynamique. Utilise meta-RL et CMDPs pour inférer la représentation latente de l'environnement, avec formulation distributional RL ajustant dynamiquement les niveaux de risque selon la précision d'estimation du contexte latent.
Lire la source
Ton avis ?
Reinforcement learningRobotiqueSécurité IAPapers

Résumé généré par Claude — vérifié par l'humain