PulseAugur
实时 17:45:29
实体 RapTB

RapTB

PulseAugur coverage of RapTB — every cluster mentioning RapTB across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_58805 ·

    新的GFlowNet训练方法提高了LLM前缀平衡性和多样性

    研究人员引入了一种新的生成流网络(GFlowNets)训练方法,称为Rooted absorbed prefix Trajectory Balance (RapTB),旨在解决大型语言模型中的前缀崩溃和长度偏差等问题。RapTB通过将子轨迹监督锚定在根部并向中间前缀传播奖励来改进信用分配。此外,还提出了一种名为SubM的子模态回放刷新策略,以对抗由有偏回放引起的分布偏移,从而在训练流中同时促进高奖励和多样性。在分子生成等任务上的实证结…