研究人员推出 EgoProactive,这是一个新的数据集和基准套件,名为 Pro extsuperscript{2}Bench,旨在评估主动式程序协助系统。这些系统旨在为任务提供实时的、循序渐进的指导,包括自主决定何时打断以及如何指导用户。该基准包含对计划外偏差和恢复步骤的明确注释,解决了现有数据集的一个关键限制。所提出的解耦规划器-交互架构,在 Llama 4 和 Qwen-3.6-VL 等模型上进行训练后,在大量实验中表现优于专有和开源基线。 AI
影响 为 AI 程序协助建立了一个新的基准,有可能改进用户指导系统和代理能力。
排序理由 该集群包含一篇研究论文,介绍了一种用于 AI 程序协助的新基准和架构。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →