研究人员开发了一种新颖的半马尔可夫强化学习方法,用于优化城市规模电动汽车(EV)叫车车队。该方法解决了调度、重新定位和充电等复杂决策问题,同时遵守充电器和馈线限制等物理约束。该系统结合了高级意图和混合整数线性规划来确保可行性,并采用鲁棒优化技术来处理不确定的需求和出行时间。在基于纽约市出租车数据的模拟器中进行的实验表明,该方法显著优于现有基线,净利润达到122万美元。 AI
影响 引入了一个用于复杂车队管理的鲁棒强化学习框架,有望提高物流和拼车服务的效率和盈利能力。
排序理由 这是一篇详细介绍特定应用新算法的研究论文。
在 Hugging Face Daily Papers 阅读 →
- Graph Convolutional Network
- Greedy
- MADDPG
- MAPPO
- NYC
- Semi-Markov Reinforcement Learning
- Wasserstein-1
- Soft Actor-Critic
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →