PulseAugur
实时 11:02:39
English(EN) GenSpan: Generation-Calibrated Motion Span Priors for Multi-Verb Video Corpus Moment Retrieval

GenSpan 框架改进了复杂动作查询的视频检索

研究人员开发了 GenSpan,一个用于视频语料库瞬间检索的新框架,该框架专门解决了多动词查询的挑战。GenSpan 利用从字幕线索生成的辅助视频作为时间先验,指导检索过程。这种方法提高了视频和时间片段识别的准确性,尤其是在复杂动作序列方面,同时与现有方法相比还降低了计算需求。 AI

影响 增强了复杂、多动作查询的视频搜索能力,可能改进内容发现和分析工具。

排序理由 这是一篇描述视频检索新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Yunzhuo Sun, Xinyue Liu, Yanyang Li, Nanding Wu, Linlin Zong, Xianchao Zhang, Wenxin Liang ·

    GenSpan: Generation-Calibrated Motion Span Priors for Multi-Verb Video Corpus Moment Retrieval

    arXiv:2603.22121v2 Announce Type: replace-cross Abstract: Video Corpus Moment Retrieval (VCMR) aims to retrieve both the correct video and its temporal segment corresponding to a natural-language query, a task that is especially challenging for multi-verb queries where temporal a…