English(EN) Em-Garde: A Propose-Match Framework for Proactive Streaming Video Understanding

新的Em-Garde框架增强了主动视频理解能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了Em-Garde，一个旨在提高主动流媒体视频理解效率和准确性的新框架。该框架将语义理解与流媒体感知分离，从而在计算约束下实现更有效的响应。Em-Garde使用指令引导的提议解析器将用户查询转换为视觉提议，并使用轻量级提议匹配模块在视频流中进行高效匹配。在基准数据集上的实验表明，Em-Garde在准确性和效率方面均优于以往的模型。 AI

影响该框架可能带来更高效、更具响应性的用于分析流媒体视频内容的AI系统。

排序理由该集群包含一篇详细介绍视频理解新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yikai Zheng, Xin Ding, Yifan Yang, Shiqi Jiang, Hao Wu, Qianxi Zhang, Weijun Wang, Ting Cao, Yunxin Liu · 2026-06-30 04:00

Em-Garde: A Propose-Match Framework for Proactive Streaming Video Understanding

arXiv:2603.19054v2 Announce Type: replace-cross Abstract: Recent advances in Streaming Video Understanding has enabled a new interaction paradigm where models respond proactively to user queries. Current proactive VideoLLMs rely on per-frame triggering decision making, which suff…

报道来源 [1]

Em-Garde: A Propose-Match Framework for Proactive Streaming Video Understanding

相关话题