研究人员推出了一种新颖的CADO框架,旨在改进用于组合优化问题的基于热图的求解器。与专注于模仿数据结构的传统监督学习方法不同,CADO直接优化最终解码解决方案的成本。这是通过将扩散去噪过程构建为马尔可夫决策过程并采用以地面真实标签为基线的标签中心奖励系统来实现的。该框架还采用了混合微调以实现高效的参数适应,并在各种基准测试中展示了最先进的性能。 AI
影响 通过直接最小化解决方案成本来优化组合优化求解器,可能提高复杂问题解决的效率。
排序理由 该集群包含一篇详细介绍组合优化新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- CADO
- Hybrid Fine-Tuning
- Hyungseok Song
- Label-Centered Reward
- Markov decision process
- reinforcement learning
- supervised learning
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →