English(EN) Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

麻将强化学习模拟器 Mahjax 在 GPU 上达到每秒 200 万步

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-20 00:33

研究人员开发了 Mahjax，一个用于复杂日本麻将（Riichi Mahjong）游戏的新型 GPU 加速模拟器，该模拟器使用 JAX 实现。该工具旨在促进强化学习研究，特别是让代理从零开始学习，而不是依赖人类对局数据。Mahjax 实现了高吞吐量，在多块 GPU 上每秒可处理多达 200 万步，并已通过训练代理以提高其性能得到验证。 AI

影响为复杂游戏的规模化强化学习研究提供了支持，有望带来更通用的 AI 决策能力。

排序理由该集群描述了一篇关于强化学习模拟器的新研究论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Soichiro Nishimori, Shinri Okano, Keigo Habara, Sotetsu Koyamada, Eason Yu, Masashi Sugiyama · 2026-05-22 04:00

Mahjax：JAX 中用于强化学习的 GPU 加速麻将模拟器

arXiv:2605.20577v1 Announce Type: new Abstract: Riichi Mahjong is a multi-player, imperfect-information game characterized by stochasticity and high-dimensional state spaces. These attributes present a unique combination of challenges that mirror complex real-world decision-makin…
Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-20 00:33

Mahjax：JAX 中用于强化学习的 GPU 加速麻将模拟器

Riichi Mahjong is a multi-player, imperfect-information game characterized by stochasticity and high-dimensional state spaces. These attributes present a unique combination of challenges that mirror complex real-world decision-making problems in reinforcement learning. While prio…

报道来源 [2]

Mahjax：JAX 中用于强化学习的 GPU 加速麻将模拟器

Mahjax：JAX 中用于强化学习的 GPU 加速麻将模拟器

相关实体

相关话题