PulseAugur
实时 21:19:04
实体 E-GRM

E-GRM

PulseAugur coverage of E-GRM — every cluster mentioning E-GRM across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_15978 ·

    新型 E-GRM 模型仅在需要时触发复杂推理

    研究人员开发了 E-GRM,一个高效的生成式奖励建模框架,通过仅在必要时选择性地采用思维链(CoT)提示来增强 LLM 的推理能力。该方法利用来自并行生成收敛的模型内部不确定性,以避免在简单任务上产生不必要的计算成本。此外,E-GRM 包含一个轻量级的判别式评分器,具有混合回归-排名目标,用于更精确地评估推理路径,从而提高准确性并降低推理费用。