PulseAugur
实时 10:07:21
实体 Dual Advantage Fields

Dual Advantage Fields

PulseAugur coverage of Dual Advantage Fields — every cluster mentioning Dual Advantage Fields across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70280 ·

    新方法使用双重优势场增强离线强化学习

    研究人员推出了一种新颖的离线目标条件强化学习方法——双重优势场(DAF)。DAF通过学习一个预测状态变化的动作效应模型,将双重价值模型转化为局部优势信号。该方法根据动作与目标方向的一致性对其进行评分,从而有效地计算目标条件贝尔曼优势。在OGBench运动、操控和谜题任务上的实验表明,DAF能够提高性能,尤其是在最优动作偏离直接目标寻求的场景中。