Retour au feed
arXiv cs.LG·

Smart Transportation Without Neurons -- Fair Metro Network Expansion with Tabular Reinforcement Learning

Signal
72
Hype
15
En 3 lignesMéthode de renforcement tabulaire pour l'expansion de réseaux de métro (MNEP). Reformulation en processus de décision non-markovien (NMRDP) : performance comparable à Deep RL avec 18× moins d'épisodes d'entraînement et 12× moins d'émissions carbone. Intègre critères d'équité sociale. Validé sur Xi'an et Amsterdam.
Lire la source
Ton avis ?
Reinforcement learningBenchmarksPapers

Résumé généré par Claude — vérifié par l'humain