PulseAugur
实时 16:38:48
English(EN) TSA: Temporal Slot Activation for Persistent Object-Centric Video Representation

新的TSA方法增强了无监督视频对象学习

研究人员引入了时间槽激活(TSA),这是一种旨在改进无监督视频对象中心学习的新机制。TSA通过学习每个槽、每帧的激活分数来管理对象表示的生命周期,从而解决了现有方法的局限性。通过将非活动槽锚定到其先前状态并抑制其参与解码,可以防止状态漂移和重建干扰。TSA还包含一个时间上下文编码器,以增强部分遮挡和逐渐重新出现期间的激活预测,在各种基准测试中展示了对象分解和时间身份保留方面的显著改进。 AI

影响 提高了视频中的对象分解和时间身份保留能力,尤其是在长序列和被遮挡的序列中。

排序理由 这是一篇描述一种新的无监督视频对象中心学习方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Duc Nguyen, Sieu Tran, Hao Vo, Khoa Vo, Duy Minh Ho Nguyen, Nghi D. Q. Bui, Anh Nguyen, Long Mai, Ngan Le ·

    TSA: Temporal Slot Activation for Persistent Object-Centric Video Representation

    arXiv:2606.13714v1 Announce Type: new Abstract: Unsupervised video object-centric learning aims to decompose dynamic scenes into temporally persistent entity representations. Existing recurrent video slot-attention methods propagate a fixed set of slots across frames, but typical…