实体
MSR-VTT
MSR-VTT
PulseAugur coverage of MSR-VTT — every cluster mentioning MSR-VTT across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
PEEK方法高效选择关键视频帧用于字幕生成
研究人员开发了PEEK,一种从视频中选择关键帧以生成字幕的高效方法。该技术将知识从大型教师模型蒸馏到小型模型中,使其能够以最小的计算开销识别最相关的帧。PEEK的性能优于现有方法,尤其是在使用少量帧时,并且与其他自适应采样方法相比,显著减少了处理时间。
-
新GLCCL方法提升文本-视频检索准确性
研究人员开发了一种名为全局-局部对比一致性学习(GLCCL)的新方法,以改进文本-视频检索。该方法使用一个无参数模块,在文本查询的指导下,从视频帧和完整视频中生成语义特征。采用了一种新颖的对比分数一致性损失函数,以增强模型区分相关和不相关视频-文本对的能力,从而在基准数据集上取得卓越的性能。