研究人员推出了一种用于零样本动作识别的新方法CEZSAR,该方法利用对比学习来弥合文本描述与视觉表示之间的语义鸿沟。该方法将视频及其对应的自然语言描述编码到共享的嵌入空间中。为了增强训练,CEZSAR采用自动负采样程序来生成不成对的数据,有效地用不相关的视觉和文本元素扩充数据集。该方法在UCF-101和Kinetics-400数据集上取得了最先进的性能。 AI
影响 引入了一种新颖的对比学习方法用于零样本动作识别,有望提高对未见动作分类任务的性能。
排序理由 这是一篇详细介绍零样本动作识别新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →