研究人员开发了一种名为 TIME(Temporally Informed Motion Embedding,时间感知运动嵌入)的新方法,该方法利用运动进行高效的视频表示学习。该方法使用在合成运动数据(特别是点轨迹)上训练的掩码自动编码器来重建缺失的运动。通过专注于运动,TIME 显著减少了对海量训练数据集的需求,并绕过了依赖语言的范式,从而实现了更好的时间理解和细粒度概念学习。 AI
影响 这种方法可能带来更具可扩展性和时间感知的视频模型,减少对大型数据集和语言监督的依赖。
排序理由 该集群包含一篇详细介绍视频表示学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →