PulseAugur
实时 11:38:19
实体 Ren et al.

Ren et al.

PulseAugur coverage of Ren et al. — every cluster mentioning Ren et al. across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_11907 ·

    研究人员开发了用于具有共同噪声的均值场控制的连续时间q学习

    这篇分为两部分的论文介绍了在具有共同噪声的均值场控制中进行连续时间Q学习的理论基础和算法。第一部分建立了理论框架,定义了集成Q函数(Iq函数),并推导了最优策略作为不动点的条件。第二部分在此基础上,设计了包括Actor-Critic方法在内的Q学习算法,并证明了它们在线性二次和其他设置中的收敛性和性能。