研究人员开发了一个新框架,以增强深度强化学习求解器在多目标组合优化问题上的鲁棒性。该框架包括一种对抗性攻击方法,用于生成揭示求解器弱点的挑战性实例,以及一种对抗性训练策略,以提高在未见数据上的性能。在各种优化问题上的实验表明,所提出的攻击能有效识别求解器漏洞,而防御机制则显著提升了神经求解器的鲁棒性和泛化能力。 AI
影响 增强了AI求解器在复杂优化任务中的可靠性,有望提高物流和运营效率。
排序理由 这是一篇详细介绍新框架和改进AI求解器方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- Deep reinforcement learning
- Multi-objective capacitated vehicle routing problem
- Multi-objective knapsack problem
- Multi-objective traveling salesman problem
- Wei Liu
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →