English(EN) VSAS-Bench: Real-Time Evaluation of Visual Streaming Assistant Models

VSAS-Bench 框架评估实时视觉流式助手

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-07 04:00

研究人员推出了 VSAS-Bench，这是一个旨在实时评估视觉流式助手模型的新框架。与之前的离线基准测试不同，VSAS-Bench 纳入了积极性和一致性指标，这对于响应连续输入流的助手至关重要。该基准测试包含超过 18,000 个时间密集型标注和标准化的评估协议，以分析各种设计因素下的准确性-延迟权衡。 AI

影响为实时视觉助手引入了新的评估标准，可能影响未来的模型开发和部署。

排序理由这是一篇介绍新的人工智能模型评估基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Pavan Kumar Anasosalu Vasu, Cem Koc, Fartash Faghri, Chun-Liang Li, Bo Feng, Zhengfeng Lai, Meng Cao, Oncel Tuzel, Hadi Pouransari · 2026-05-07 04:00

VSAS-Bench：视觉流式助手模型的实时评估

arXiv:2604.07634v2 Announce Type: replace Abstract: Streaming vision-language models (VLMs) continuously generate responses given an instruction prompt and an online stream of input frames. This is a core mechanism for real-time visual assistants. Existing VLM frameworks predomin…

报道来源 [1]

VSAS-Bench：视觉流式助手模型的实时评估

相关实体

相关话题