English(EN) EMCompress: Video-LLMs with Endomorphic Multimodal Compression

EMCompress 推出新颖的视频大模型压缩方法，提升效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员推出 EMCompress，一种提高视频大模型在长视频推理任务中效率的新颖方法。该方法使用一种受认知启发的内omorphic多模态压缩（EMC）技术来压缩视频和查询输入，同时保留准确问答所需的重要信息。通过作为模块化前端，EMCompress 可以集成到现有的视频指令调优和视频问答流程中，在训练和推理效率方面均显示出显著的提升。 AI

影响提高了视频大模型在长视频推理方面的效率，可能降低复杂视频分析任务的计算成本。

排序理由该集群包含一篇详细介绍视频大模型中多模态压缩新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Zheyu Fan, Jiateng Liu, Yuji Zhang, Zihan Wang, Yi R. Fung, Manling Li, Heng Ji · 2026-04-28 04:00

EMCompress：具有内omorphic多模态压缩的视频-LLM

arXiv:2508.21094v3 Announce Type: replace Abstract: Video-LLMs face a fundamental tension in long-video reasoning: static, sparse frame sampling either dilutes evidence across task-irrelevant segments at significant cost or misses fine-grained temporal semantics altogether. We pr…

报道来源 [1]

EMCompress：具有内omorphic多模态压缩的视频-LLM

相关实体

相关话题