新流程通过时间推理增强视频问答能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员为TimeLogicQA基准开发了一个新颖的流程，旨在提高视频问答系统对时间关系进行推理的能力。他们的系统将视觉感知与符号化时间推理分开，将问题解析为特定组件，然后根据时长和复杂性路由视频。一个多模态LLM生成结构化的视觉证据，然后由程序化验证器和确定性缩减器进行处理，以应用时间规则并得出答案。 AI

影响引入了一种结构化的时间推理方法用于视频问答，可能提高AI理解和回答关于事件序列问题的能力。

排序理由这是一篇详细介绍特定基准新系统的研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Yuyang Sun, Yongliang Wu, Xingyu Zhu, Yuxia Chen, Zhenxiang Jiang, Yangguang Ji, Wenbo Zhu, Yanxi Shi, Jay Wu, Shuo Wang, Xu Yang · 2026-06-02 04:00

Temporal Evidence Routing with Structured Visual Evidence for TimeLogicQA

arXiv:2606.01106v1 Announce Type: new Abstract: TimeLogicQA evaluates whether video question answering systems can reason over temporal relations such as event existence, ordering, persistence, boundary conditions, and overlap. We address this task with a visual evidence routing …

报道来源 [1]

Temporal Evidence Routing with Structured Visual Evidence for TimeLogicQA

相关实体

相关话题