PulseAugur
实时 19:01:20
实体 Source-Grounded Semantic Reinforcement Learning

Source-Grounded Semantic Reinforcement Learning

PulseAugur coverage of Source-Grounded Semantic Reinforcement Learning — every cluster mentioning Source-Grounded Semantic Reinforcement Learning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_58727 ·

    新的强化学习框架提升低资源语言生成能力

    研究人员开发了一个名为源语言语义强化学习(SG-SRL)的新框架,以改进低资源目标语言的生成。该方法通过将丰富的源语言单语数据转换为跨语言语义监督来加以利用。SG-SRL 使用带有跨语言语义奖励模型的强化学习,然后用少量平行语料库进行精炼,以确保流畅性和简洁性。实验表明,与标准的监督微调相比,该方法在语义基础和事实覆盖方面有所改进。