研究人员开发了ScriptHOI,一种用于开放词汇人体-物体交互检测的新型框架。该方法将交互短语分解为特定的状态槽,如身体角色和接触,从而实现超越简单共现的更细致的理解。ScriptHOI利用视觉状态分词器和槽位匹配来评估脚本覆盖和冲突,从而改进了对罕见交互的识别并减少了误报。该方法还结合了区间部分标签学习,以更好地处理不完整的标注。 AI
影响 增强了AI系统在视觉场景中理解复杂人类动作的能力,改进了机器人和监控等应用。
排序理由 这是一篇详细介绍人体-物体交互检测新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →