Retour au feed
Hugging Face Blog·

Train your first Decision Transformer

Signal
65
Hype
25
En 3 lignesHugging Face publie un guide pour entraîner un Decision Transformer, modèle qui apprend des politiques de contrôle à partir de trajectoires d'expert. Le tutoriel couvre l'implémentation pratique et l'intégration avec la bibliothèque Transformers.
Lire la source
Ton avis ?
Reinforcement learningGénération de codeOutils

Résumé généré par Claude — vérifié par l'humain