arXiv cs.AI·19 mai 2026

Scheduling That Speaks: An Interpretable Programmatic Reinforcement Learning Framework

Signal

Hype

En 3 lignesProRL est un framework de reinforcement learning programmatique pour l'optimisation combinatoire (job shop scheduling). Il génère des politiques interprétables sous forme de programmes lisibles via un DSL spécialisé (DSL-S), explorant l'espace des programmes par recherche locale et optimisation bayésienne. Surpasse les heuristiques classiques et baselines DRL avec peu d'épisodes d'entraînement.

Lire la source

Ton avis ?

Reinforcement learning Raisonnement Benchmarks Open source

Résumé généré par Claude — vérifié par l'humain

Scheduling That Speaks: An Interpretable Programmatic Reinforcement Learning Framework

Autres angles sur ce sujet