English(EN) Hierarchical Policies from Verbal and Egocentric Human Signals for Natural Human-Robot Interaction

机器人交互框架使用视觉和语音来理解意图

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 04:00

研究人员开发了一个名为 EDITH 的新框架，该框架集成了口头和非口头人类信号，以实现更自然的人机交互。该系统捕获智能眼镜中的第一人称视频、注视和语音，并将其与语言指令一起使用以推断人类意图。EDITH 采用分层策略来分解任务，并使用视觉流中的关键帧来锚定任务，与仅使用语言命令相比，这大大减少了用户的工作量。 AI

影响通过整合视觉线索增强机器人对人类意图的理解，可能导致更直观、更高效的人机协作。

排序理由关于人机交互新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

EDITH

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Dongjun Lee, Juheon Choi, Dong Kyu Shin, Sinjae Kang, Kimin Lee · 2026-06-10 04:00

用于自然人机交互的来自语言和以自我为中心的信号的分层策略

arXiv:2606.10276v1 Announce Type: cross Abstract: For natural human-robot interaction, a robot must understand human intent expressed not only through language but also through nonverbal signals such as gestures and gaze. However, current robot policies rely on language instructi…

报道来源 [1]

用于自然人机交互的来自语言和以自我为中心的信号的分层策略

相关实体

相关话题