PulseAugur
实时 10:33:34
实体 RM-Bench

RM-Bench

PulseAugur coverage of RM-Bench — every cluster mentioning RM-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_77334 ·

    AdaJudge框架通过自适应池化改进LLM奖励建模

    研究人员推出AdaJudge,一个旨在提高大型语言模型(LLM)奖励建模准确性的新颖框架。该方法通过自适应模型表示及其聚合方法,解决了当前静态池化策略的局限性。AdaJudge采用门控细化块来创建面向判别的表示,并使用自适应多视角池化模块进行动态证据组合。在RM-Bench和JudgeBench上的实验表明,AdaJudge的性能优于现有的奖励模型和池化基线。