研究人员开发了一个名为RAST-MoE-RL的新框架,以提高网约车服务的效率。该框架在深度强化学习中采用了专家混合(MoE)方法,以更好地处理网约车平台典型的复杂动态供需状况。通过允许专业专家适应不同的运营场景,该系统旨在减少匹配和接载延迟,其表现优于现有方法,且参数数量显著减少。 AI
影响 引入了一个专门的MoE-RL框架,可以提高大规模时空决策任务(如网约车)的效率。
排序理由 这是一篇详细介绍深度强化学习新框架的研究论文。
- Markov Decision Process
- Mixture-of-Experts
- RAST-MoE-RL
- Reinforcement Learning
- San Francisco
- Uber
- Yuhan Tang
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →