PulseAugur
实时 13:47:48
English(EN) MuKV: Multi-Grained KV Cache Compression for Long Streaming Video Question-Answering

MuKV 方法提高了视频问答的效率和准确性

研究人员开发了 MuKV,一种用于提高长视频流问答系统效率和准确性的新方法。MuKV 通过采用多粒度 KV 缓存压缩模块和半分层检索方法来应对处理大量视觉令牌的挑战。该技术在块、帧和片段级别提取视觉表示,在优化内存使用量的同时保留局部细节和时间上下文。实验表明,MuKV 在不影响内存或在线问答效率的情况下显著提高了答案的准确性。 AI

影响 提高了处理长视频内容的 AI 系统的效率和准确性,可能改进视频分析和摘要等应用。

排序理由 该集群包含一篇详细介绍视频问答新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Junbin Xiao, Jiajun Chen, Tianxiang Sun, Xun Yang, Angela Yao ·

    MuKV: Multi-Grained KV Cache Compression for Long Streaming Video Question-Answering

    arXiv:2605.22269v1 Announce Type: new Abstract: Long streaming video QA remains challenging due to growing visual tokens and limited reasoning length of large language models (LLMs). KV-caching stores the Key-Value (KV) of the historical tokens via LLM prefill and enables more ef…

  2. arXiv cs.CV TIER_1 English(EN) · Angela Yao ·

    MuKV: Multi-Grained KV Cache Compression for Long Streaming Video Question-Answering

    Long streaming video QA remains challenging due to growing visual tokens and limited reasoning length of large language models (LLMs). KV-caching stores the Key-Value (KV) of the historical tokens via LLM prefill and enables more efficient streaming QA. However, existing methods …