Scheduling That Speaks: An Interpretable Programmatic Reinforcement Learning Framework
Signal
75
Hype
15
En 3 lignesProRL est un framework de reinforcement learning programmatique pour l'optimisation combinatoire (job shop scheduling). Il génère des politiques interprétables sous forme de programmes lisibles via un DSL spécialisé (DSL-S), explorant l'espace des programmes par recherche locale et optimisation bayésienne. Surpasse les heuristiques classiques et baselines DRL avec peu d'épisodes d'entraînement.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain