English(EN) RAST-MoE-RL: A Regime-Aware Spatio-Temporal MoE Framework for Deep Reinforcement Learning in Ride-Hailing

RAST-MoE-RL框架通过专业AI专家提升网约车效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了一个名为RAST-MoE-RL的新框架，以提高网约车服务的效率。该框架在深度强化学习中采用了专家混合（MoE）方法，以更好地处理网约车平台典型的复杂动态供需状况。通过允许专业专家适应不同的运营场景，该系统旨在减少匹配和接载延迟，其表现优于现有方法，且参数数量显著减少。 AI

影响引入了一个专门的MoE-RL框架，可以提高大规模时空决策任务（如网约车）的效率。

排序理由这是一篇详细介绍深度强化学习新框架的研究论文。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Yuhan Tang, Kangxin Cui, Jung Ho Park, Yibo Zhao, Xuan Jiang, Haoze He, Jiangbo Yu, Haris Koutsopoulos, Jinhua Zhao · 2026-05-05 04:00

RAST-MoE-RL: A Regime-Aware Spatio-Temporal MoE Framework for Deep Reinforcement Learning in Ride-Hailing

arXiv:2512.13727v2 Announce Type: replace Abstract: Ride-hailing platforms face the challenge of balancing passenger waiting times with overall system efficiency under highly uncertain supply-demand conditions. Adaptive delayed matching, which controls the holding intervals for b…