研究人员开发了 GenSpan,一个用于视频语料库瞬间检索的新框架,该框架专门解决了多动词查询的挑战。GenSpan 利用从字幕线索生成的辅助视频作为时间先验,指导检索过程。这种方法提高了视频和时间片段识别的准确性,尤其是在复杂动作序列方面,同时与现有方法相比还降低了计算需求。 AI
影响 增强了复杂、多动作查询的视频搜索能力,可能改进内容发现和分析工具。
排序理由 这是一篇描述视频检索新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →