研究人员推出AdaJudge,一个旨在提高大型语言模型(LLM)奖励建模准确性的新颖框架。该方法通过自适应模型表示及其聚合方法,解决了当前静态池化策略的局限性。AdaJudge采用门控细化块来创建面向判别的表示,并使用自适应多视角池化模块进行动态证据组合。在RM-Bench和JudgeBench上的实验表明,AdaJudge的性能优于现有的奖励模型和池化基线。 AI
影响 通过改进奖励建模来增强LLM对齐,可能导致更细致、更符合人类的AI行为。
排序理由 这是一篇详细介绍LLM奖励建模新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →