PulseAugur
实时 17:46:24
实体 Chen Ruishuo

Chen Ruishuo

PulseAugur coverage of Chen Ruishuo — every cluster mentioning Chen Ruishuo across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_51120 ·

    新的 GFlowNet 训练方法改进了离线学习

    研究人员开发了一种新的无代理生成流网络(GFlowNets)训练框架,称为轨迹蒸馏 GFlowNet(TD-GFN)。该方法使用逆强化学习从离线轨迹中提取详细奖励,提供比以往方法更丰富的指导。TD-GFN 通过依赖真实终端奖励来确保训练稳定性,避免错误传播,并在收敛性和样本质量方面优于现有方法。