PulseAugur
实时 09:26:52
实体 RMR-75K

RMR-75K

PulseAugur coverage of RMR-75K — every cluster mentioning RMR-75K across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_08622 ·

    新的RbtAct方法使用反驳来训练LLM生成可操作的科学审稿反馈

    研究人员开发了一种名为RbtAct的新方法,以提高大型语言模型为科学同行评审生成的反馈的可操作性。该方法利用现有的同行评审反驳作为隐式监督,学习哪些审稿人评论导致了具体的修改。创建了一个名为RMR-75K的新数据集,用于将审稿片段映射到其对应的反驳片段,从而能够训练Llama-3.1-8B-Instruct等模型以提供更具体、可实施的指导。