arXiv cs.AI·19 mai 2026

When Dynamics Shift, Robust Task Inference Wins: Offline Imitation Learning with Behavior Foundation Models Revisited

Signal

Hype

En 3 lignesLes Behavior Foundation Models (BFMs) permettent l'apprentissage par imitation à grande échelle, mais échouent sous les changements de dynamique (friction, actuation, bruit). Cet article formule l'inférence de tâche BFM comme un problème d'optimisation minimax robuste, permettant l'adaptation aux perturbations de dynamique sans modifier le préentraînement. Le cadre surpasse les baselines BFM et offline IL robustes.

Lire la source

Ton avis ?

Reinforcement learning Papers Évaluations Sécurité IA

Résumé généré par Claude — vérifié par l'humain

When Dynamics Shift, Robust Task Inference Wins: Offline Imitation Learning with Behavior Foundation Models Revisited

Autres angles sur ce sujet