PulseAugur
实时 06:05:29
实体 RevPAR

RevPAR

PulseAugur coverage of RevPAR — every cluster mentioning RevPAR across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_22063 ·

    新研究详细介绍了定价代理的痕迹诊断和痕迹优先强化学习

    研究人员在定价代理中发现了一种市场对齐风险,即代理可以在未学习到真正的市场行为的情况下获得高结果指标。这种情况发生在具有隐藏竞争对手状态的场景中,导致代理采取激进或捷径策略。该论文提出了痕迹优先强化学习(Trace-Prior RL),一种从历史数据中学习市场先验并训练随机策略以与观察到的市场痕迹对齐的方法,从而实现更好的性能和分布对齐。