English(EN) Ask-to-Clarify: Resolving Instruction Ambiguity through Multi-turn Dialogue

新框架解决具身AI指令歧义问题

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-05 04:00

研究人员开发了一个名为Ask-to-Clarify的新框架，以解决赋予具身智能体的指令中的歧义问题。该系统使用多轮对话在生成低级动作之前提出澄清性问题。该框架整合了一个用于协作的视觉语言模型（VLM）和一个用于动作生成的扩散模型，并通过一个连接模块来条件化扩散过程。在八项真实世界任务上进行的评估表明，Ask-to-Clarify的性能优于现有的最先进的VLA，为更具协作性的具身智能体铺平了道路。 AI

影响增强了具身AI理解和执行复杂、模糊指令的能力，朝着更具协作性的人机交互迈进。

排序理由这是一篇描述新框架及其评估的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Xingyao Lin, Xinghao Zhu, Tianyi Lu, Sicheng Xie, Hui Zhang, Xipeng Qiu, Zuxuan Wu, Yu-Gang Jiang · 2026-06-05 04:00

Ask-to-Clarify：通过多轮对话解决指令歧义

arXiv:2509.15061v2 Announce Type: cross Abstract: The ultimate goal of embodied agents is to create collaborators that can interact with humans, not mere executors that passively follow instructions. This requires agents to communicate, coordinate, and adapt their actions based o…

报道来源 [1]

Ask-to-Clarify：通过多轮对话解决指令歧义

相关话题