Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark
Signal
82
Hype
15
En 3 lignesRL4F est un benchmark open-source d'apprentissage par renforcement hors-ligne pour le contrôle du plasma dans la fusion nucléaire. Basé sur des données historiques du tokamak DIII-D, il évalue des méthodes imitation learning et offline RL sur quatre tâches de suivi multi-actuateurs (rotation, densité, température, pression). Les méthodes offline model-based RL obtiennent les meilleures performances moyennes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain