PulseAugur
实时 12:05:02
实体 BA-TDRC

BA-TDRC

PulseAugur coverage of BA-TDRC — every cluster mentioning BA-TDRC across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_58604 ·

    AI研究通过新的时序差分方法推进离策略预测

    两篇新研究论文探讨了离策略时序差分学习在AI领域的进展。第一篇论文介绍了STHTD-MP,一种利用行为策略转换信息来改善预测几何形状的方法,其平均收缩因子可能比现有方法更小。第二篇论文提出了BA-TDC和BA-TDRC,它们用行为贝尔曼矩阵取代了标准的辅助协方差几何,证明了这种行为感知方法是有益的,尽管在复杂场景下仍需要正则化以获得稳健的性能。