English(EN) GenSpan: Generation-Calibrated Motion Span Priors for Multi-Verb Video Corpus Moment Retrieval

GenSpan 框架改进了复杂动作查询的视频检索

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-04 04:00

研究人员开发了 GenSpan，一个用于视频语料库瞬间检索的新框架，该框架专门解决了多动词查询的挑战。GenSpan 利用从字幕线索生成的辅助视频作为时间先验，指导检索过程。这种方法提高了视频和时间片段识别的准确性，尤其是在复杂动作序列方面，同时与现有方法相比还降低了计算需求。 AI

影响增强了复杂、多动作查询的视频搜索能力，可能改进内容发现和分析工具。

排序理由这是一篇描述视频检索新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yunzhuo Sun, Xinyue Liu, Yanyang Li, Nanding Wu, Linlin Zong, Xianchao Zhang, Wenxin Liang · 2026-06-04 04:00

GenSpan：用于多动词视频语料库时刻检索的生成校准运动跨度先验

arXiv:2603.22121v2 Announce Type: replace-cross Abstract: Video Corpus Moment Retrieval (VCMR) aims to retrieve both the correct video and its temporal segment corresponding to a natural-language query, a task that is especially challenging for multi-verb queries where temporal a…