研究人员开发了一种新的方法,使用基于Transformer的深度强化学习方法来解决开放式车间调度问题(OSSP)。该模型在较小的基准实例上进行训练,能够泛化到显著更大的问题而无需重新训练。基于Transformer的策略提供了一种基于学习的替代传统调度规则的方法,在性能上可与EST等成熟启发式算法相媲美,并在大规模实例上优于SPT和LPT。 AI
排序理由 这是一篇研究论文,详细介绍了一种解决特定计算问题的新颖方法。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Deep Reinforcement Learning
- Estonian
- longest-processing-time-first scheduling
- MWKR
- Open shop scheduling problems with late work criteria
- Sony Pictures Television
- Taillard benchmark instances
- transformer
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →