PulseAugur
实时 08:26:42
English(EN) Pro$^2$Assist: Continuous Step-Aware Proactive Assistance with Multimodal Egocentric Perception for Long-Horizon Procedural Tasks

Pro$^2$Assist 使用AR和LLM提供主动式程序化任务指导

研究人员开发了Pro$^2$Assist,一个新颖的多模态大语言模型系统,旨在为复杂、长时序的程序化任务提供连续的、步进感知的、主动式辅助。与大多数被动式助手不同,Pro$^2$Assist 利用AR眼镜的数据来感知用户动作并实时理解任务进展。该系统从时间动态和专家知识中提取程序化上下文,以推断用户需求并提供及时的指导,在动作理解和主动式时机准确性方面优于现有方法。 AI

影响 该系统展示了朝着更主动、更具上下文感知能力的人工智能助手迈出的重要一步,可用于复杂的现实世界任务。

排序理由 该集群描述了一篇详细介绍新颖系统及其评估的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Pro$^2$Assist 使用AR和LLM提供主动式程序化任务指导

报道来源 [1]

  1. Hugging Face Daily Papers TIER_1 English(EN) ·

    Pro$^2$Assist: Continuous Step-Aware Proactive Assistance with Multimodal Egocentric Perception for Long-Horizon Procedural Tasks

    Procedural tasks with multiple ordered steps are ubiquitous in daily life. Recent advances in multimodal large language models (MLLMs) have enabled personal assistants that support daily activities. However, existing systems primarily provide reactive guidance triggered by user q…