实体
Greedy
Greedy
PulseAugur coverage of Greedy — every cluster mentioning Greedy across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
New 'Delight-gated exploration' algorithm optimizes vast action spaces
Researchers have introduced Delight-gated exploration (DE), a novel algorithm designed to optimize decision-making in scenarios with vast action spaces. DE prioritizes exploratory actions based on their potential "delig…
-
研究人员开发用于城市规模电动汽车叫车服务的半马尔可夫强化学习
研究人员开发了一种新颖的半马尔可夫强化学习方法,用于优化城市规模电动汽车(EV)叫车车队。该方法解决了调度、重新定位和充电等复杂决策问题,同时遵守充电器和馈线限制等物理约束。该系统结合了高级意图和混合整数线性规划来确保可行性,并采用鲁棒优化技术来处理不确定的需求和出行时间。在基于纽约市出租车数据的模拟器中进行的实验表明,该方法显著优于现有基线,净利润达到122万美元。