Retour au feed
arXiv cs.AI·

Scheduling That Speaks: An Interpretable Programmatic Reinforcement Learning Framework

Signal
75
Hype
15
En 3 lignesProRL est un framework de reinforcement learning programmatique pour l'optimisation combinatoire (job shop scheduling). Il génère des politiques interprétables sous forme de programmes lisibles via un DSL spécialisé (DSL-S), explorant l'espace des programmes par recherche locale et optimisation bayésienne. Surpasse les heuristiques classiques et baselines DRL avec peu d'épisodes d'entraînement.
Lire la source
Ton avis ?
Reinforcement learningRaisonnementBenchmarksOpen source

Résumé généré par Claude — vérifié par l'humain