PulseAugur
实时 21:54:01
实体 GemmaX-28-9B

GemmaX-28-9B

PulseAugur coverage of GemmaX-28-9B — every cluster mentioning GemmaX-28-9B across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_06677 ·

    新的强化学习框架通过自奖励和新词感知方法推进机器翻译

    研究人员开发了SSR-Zero,一个新颖的用于机器翻译的强化学习框架,它消除了对外部人工标注数据或预训练奖励模型的需求。通过利用自评估奖励和Qwen-2.5-7B骨干模型,SSR-Zero在英汉翻译任务上取得了优于现有模型的性能。通过外部监督进行的进一步增强,如在SSR-X-Zero-7B中所见,已实现了最先进的性能,超越了开源和闭源的替代品。