PulseAugur
实时 10:25:55
English(EN) Momentum-Guided Semantic Forecasting (MoFore) for Self-Supervised Video Representation Learning

新的 MoFore 框架推动自监督视频表示学习发展

研究人员推出了一种新颖的自监督视频表示学习框架 MoFore,该框架专注于从远距离上下文剪辑预测未来的潜在嵌入。与依赖像素级重建或语义对齐的先前方法不同,MoFore 学习时间预测表示。该框架结合了随机时间间隔预测和对比正则化,以增强鲁棒性并防止表示崩溃。在 UCF101 数据集上的实验表明,MoFore 在不需要动作标签的情况下学习到了时间上一致且语义上有意义的表示。 AI

排序理由 该集群包含一篇关于自监督视频表示学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Qinwu Xu ·

    Momentum-Guided Semantic Forecasting (MoFore) for Self-Supervised Video Representation Learning

    arXiv:2606.14765v1 Announce Type: cross Abstract: Self-supervised video representation learning has recently advanced through contrastive learning, masked reconstruction, and predictive representation learning. Reconstruction-based approaches such as MAE and VideoMAE learn repres…