English(EN) From Reactive to Proactive: Assessing the Proactivity of Voice Agents via ProVoice-Bench

新的基准 ProVoice-Bench 评估语音助手的主动能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员推出 ProVoice-Bench，这是一个旨在评估语音助手主动性的新评估框架。该基准通过纳入四个用于主动干预和监控的新颖任务，解决了现有工具主要关注被动响应的局限性。使用 ProVoice-Bench 对最先进的多模态 LLM 进行的初步评估显示，在过度触发和推理等领域存在显著的性能差距，表明在创建更自然、更具上下文感知能力的主动助手方面需要进一步发展。 AI

影响引入了一个用于评估主动语音助手的新基准，突出了当前 LLM 的局限性并指导未来的发展。

排序理由这是一篇介绍新的人工智能代理评估基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Ke Xu, Yuhao Wang, Yu Wang · 2026-05-05 04:00

从被动到主动：通过 ProVoice-Bench 评估语音代理的主动性

arXiv:2604.15037v3 Announce Type: replace-cross Abstract: Recent advancements in LLM agents are gradually shifting from reactive, text-based paradigms toward proactive, multimodal interaction. However, existing benchmarks primarily focus on reactive responses, overlooking the com…

报道来源 [1]

从被动到主动：通过 ProVoice-Bench 评估语音代理的主动性

相关实体

相关话题