PulseAugur
实时 04:58:40
实体 Open-o3-Video

Open-o3-Video

PulseAugur coverage of Open-o3-Video — every cluster mentioning Open-o3-Video across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_107906 ·

    新的SER方法增强了MLLM中的视频推理能力

    研究人员推出了一种名为语义证据奖励(SER)的新方法,旨在改进多模态大型语言模型(MLLM)在细粒度时空推理方面的能力。SER将证据定位重构为一个验证任务,使用一个裁判VLM来评估模型生成的证据的相关性和定位质量,并加入时间惩罚。该方法减少了对密集标注的需求,并允许在标准的视频问答数据上进行训练。SER在V-STAR基准测试中表现出显著的改进,达到了49.6%的mLGM,比一个强大的基线模型高出3.0个百分点。