AlpacaEval
PulseAugur coverage of AlpacaEval — every cluster mentioning AlpacaEval across labs, papers, and developer communities, ranked by signal.
-
IBM 新推出的 8B Granite 4.1 模型性能超越了旧款 32B MoE 版本
IBM 发布了 Granite 4.1,这是一个专为企业设计的开源语言模型家族,包含三种尺寸(3B、8B 和 30B 参数)。值得注意的是,在 ArenaHard 和 GSM8K 等多项基准测试中,8B 密集模型表现出的性能与之前的 32B MoE 模型相当甚至更优。这一改进归功于 IBM 对数据质量的关注以及涉及 15 万亿 token 和迭代数据混合调整的复杂多阶段训练过程。
-
研究人员开发新方法来消除大型语言模型(LLM)奖励模型的偏差并改进其性能
研究人员开发了新的方法来提高用于对齐大型语言模型(LLM)的奖励模型(RM)的可靠性和可解释性。一种方法引入了因果驱动的干预技术,以在推理时减轻 RM 中的各种偏差,显示出对虚假特征的敏感性降低,而没有性能权衡。另一项开发是“reward-lens”库,它将机制可解释性工具应用于 RM,揭示线性归因并不总是能预测因果打补丁的效果。此外,一种称为时间连贯奖励建模(TCRM)的新方法将 RM 视为价值函数,从而能够进行可解释的 token…
-
新的TwDPO方法利用LLM注意力实现更好的偏好对齐
研究人员推出了一种名为Token加权直接偏好优化(TwDPO)的新方法,用于将大型语言模型与人类偏好对齐。与标准的DPO不同,TwDPO为响应中的单个token分配不同的重要性权重。提出的实现AttentionPO利用LLM自身的注意力机制动态估计这些token权重,使过程具有内容感知性和效率。实验表明,与现有的偏好优化技术相比,AttentionPO在AlpacaEval和MT-Bench等基准测试中显著提高了性能。