研究人员开发了一个新的城市电动汽车(EV)车队控制框架,该框架使用分布鲁棒强化学习(DRL)来处理不确定的需求和出行时间。这种名为PD-RSAC的方法可以优化调度、重新定位和充电决策,同时严格遵守充电器和馈线容量限制。使用纽约市出租车数据进行的实验表明,PD-RSAC将净利润显著提高到122万美元,优于各种启发式和强化学习基线。 AI
影响 该框架通过在不确定性下优化电动汽车车队运营,可以提高大规模城市出行服务的效率和盈利能力。
排序理由 详细介绍新的强化学习框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
- graph convolutional network
- Greedy
- MADDPG
- Mappō
- New York City
- PD--RSAC
- Soft Actor--Critic
- The An Nguyen
- Wasserstein-1
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →