实体
YouTube-VIS
YouTube-VIS
PulseAugur coverage of YouTube-VIS — every cluster mentioning YouTube-VIS across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的DSSA方法通过分离外观和身份来改进视频对象学习
研究人员推出了一种新颖的自监督框架Dual-State Slot Attention (DSSA),旨在改进无监督视频对象中心学习。DSSA通过在帧之间解耦对象的外观与其身份,解决了现有方法的局限性,防止了由于快速运动或遮挡导致的对象槽交换问题。该框架利用一个用于每帧外观的局部状态和一个通过学习到的循环转换更新的独立身份状态,充当时间过滤器。在MOVi-C和YouTube-VIS等数据集上的实验表明,DSSA提高了分割质量和时间一致性…
-
Grounded Correspondence框架简化视频对象学习
研究人员引入了一个名为Grounded Correspondence的新框架,用于视频对象中心学习。该方法用确定性的二分匹配取代了传统学习的动力学模块,利用现有的自监督视觉骨干网络来保持时间一致性。该方法在时间建模方面不需要任何可学习的参数,并在多个基准测试中取得了有竞争力的结果。