研究人员推出了一种新颖的上下文决策权重学习模型OTSS,该模型旨在学习决策因素的个性化权重向量,而不是直接策略。这种输出目标软分割方法区分了硬分割和软分割,与传统的硬分割相比具有理论优势。在受控基准和零售环境中的评估表明,OTSS与EM混合回归等现有方法相比,平均遗憾更低,并且速度也更快。 AI
影响 引入了一种新的决策权重学习方法,有可能改进具有上下文目标的系统的优化。
排序理由 这是一篇详细介绍新模型及其评估的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →