研究人员开发了Pro$^2$Assist,一个新颖的多模态大语言模型系统,旨在为复杂、长时序的程序化任务提供连续的、步进感知的、主动式辅助。与大多数被动式助手不同,Pro$^2$Assist 利用AR眼镜的数据来感知用户动作并实时理解任务进展。该系统从时间动态和专家知识中提取程序化上下文,以推断用户需求并提供及时的指导,在动作理解和主动式时机准确性方面优于现有方法。 AI
影响 该系统展示了朝着更主动、更具上下文感知能力的人工智能助手迈出的重要一步,可用于复杂的现实世界任务。
排序理由 该集群描述了一篇详细介绍新颖系统及其评估的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →