PulseAugur
实时 18:59:12
实体 Consensus Frame GRPO

Consensus Frame GRPO

PulseAugur coverage of Consensus Frame GRPO — every cluster mentioning Consensus Frame GRPO across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_97681 ·

    新的CF-GRPO框架增强了多模态大语言模型的视频推理能力

    研究人员推出了一种新颖的奖励框架——共识帧GRPO(CF-GRPO),旨在增强视频多模态大语言模型(Video-MLLMs)的推理能力。该框架无需时间标注,而是从内在视频线索中构建共识帧先验。然后,CF-GRPO根据视觉和响应表示计算帧使用分数,并通过共识帧奖励(CFR)优化它们的匹配度。该方法旨在提供更清晰的奖励信号,提高在视频推理基准上的性能,并提供训练过程中使用的证据帧的可解释视图。