研究人员开发了一个新的框架,使用离线强化学习(RL)来优化仓库运营的吞吐量控制。该系统通过智能管理节流来动态调整设置,以平衡最大化吞吐量与维持下游稳定性。该方法结合了历史信息的状态表示和用于延迟影响的动作空间抽象,以及一个考虑上游和下游指标的奖励函数。实证结果显示,使用CQL策略可将系统健康度提高22.97%,平均节流持续时间减少3.18%。 AI
影响 这项研究展示了离线强化学习在优化复杂运营物流方面的新颖应用,有潜力提高自动化仓库的效率。
排序理由 研究论文,详细介绍了使用离线强化学习的仓库运营新框架。
- alphaXiv
- arXiv
- CatalyzeX
- Cypher Query Language
- DagsHub
- Deep Koopman Controller Synthesis for Cyber-Resilient Market-Based Frequency Regulation
- Fitted Q-evaluation
- Gotit.pub
- Hugging Face
- IArxiv
- Influence Flower
- machine learning
- reinforcement learning
- ScienceCast
- Simultaneous localization and mapping
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →