Hugging Face Blog·8 septembre 2022

Train your first Decision Transformer

Signal

Hype

En 3 lignesHugging Face publie un guide pour entraîner un Decision Transformer, modèle qui apprend des politiques de contrôle à partir de trajectoires d'expert. Le tutoriel couvre l'implémentation pratique et l'intégration avec la bibliothèque Transformers.

Lire la source

Ton avis ?

Reinforcement learning Génération de code Outils

Résumé généré par Claude — vérifié par l'humain

Train your first Decision Transformer

Autres angles sur ce sujet