Retour au feed
arXiv cs.AI·

Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

Signal
75
Hype
15
En 3 lignesMahjax est un simulateur Riichi Mahjong entièrement vectorisé en JAX pour l'apprentissage par renforcement sur GPU. Atteint 2 millions de steps/sec sur 8 A100 NVIDIA (règles sans rouge) et 1 million (avec rouge). Démontre l'entraînement d'agents tabula rasa sans pré-entraînement supervisé.
Lire la source
Ton avis ?
Reinforcement learningInfrastructureBenchmarksOpen source

Résumé généré par Claude — vérifié par l'humain