PulseAugur
实时 12:49:07
English(EN) ScriptHOI: Learning Scripted State Transitions for Open-Vocabulary Human-Object Interaction Detection

ScriptHOI框架改进了开放词汇的人体-物体交互检测

研究人员开发了ScriptHOI,一种用于开放词汇人体-物体交互检测的新型框架。该方法将交互短语分解为特定的状态槽,如身体角色和接触,从而实现超越简单共现的更细致的理解。ScriptHOI利用视觉状态分词器和槽位匹配来评估脚本覆盖和冲突,从而改进了对罕见交互的识别并减少了误报。该方法还结合了区间部分标签学习,以更好地处理不完整的标注。 AI

影响 增强了AI系统在视觉场景中理解复杂人类动作的能力,改进了机器人和监控等应用。

排序理由 这是一篇详细介绍人体-物体交互检测新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

ScriptHOI框架改进了开放词汇的人体-物体交互检测

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Minh Anh Nguyen, Quang Huy Tran, Bao Ngoc Le, SuiYang Guang, Tuan Kiet Pham, Linh Chi Vo ·

    ScriptHOI: 学习脚本化状态转换以实现开放词汇的人体-物体交互检测

    arXiv:2605.05057v1 Announce Type: new Abstract: Open-vocabulary human-object interaction (HOI) detection requires recognizing interaction phrases that may not appear as annotated categories during training. Recent vision-language HOI detectors improve semantic transfer by matchin…

  2. arXiv cs.CV TIER_1 English(EN) · Linh Chi Vo ·

    ScriptHOI:学习脚本化状态转换以实现开放词汇量的人体-物体交互检测

    Open-vocabulary human-object interaction (HOI) detection requires recognizing interaction phrases that may not appear as annotated categories during training. Recent vision-language HOI detectors improve semantic transfer by matching human-object features with text embeddings, bu…