PulseAugur
实时 07:02:14
实体 ConsistRoll

ConsistRoll

PulseAugur coverage of ConsistRoll — every cluster mentioning ConsistRoll across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_118079 ·

    新 ConsistRoll 方法通过跨视图一致性增强多模态推理能力

    研究人员推出了一种名为 ConsistRoll 的新方法,旨在通过强制执行跨视图一致性来增强大型语言模型的多模态推理能力。该方法确保同一实例的语义不变视图产生一致的答案,从而解决了标准可验证奖励强化学习 (RLVR) 目标中的一个局限性。ConsistRoll 通过将原始视图和转换视图分组,仅当两个视图都正确且一致时才分配联合奖励,从而将此一致性偏差整合到 RLVR 训练中,在不增加额外生成开销或标注的情况下提高了各种推理领域的性能。