PulseAugur
实时 11:31:48
实体 ClipSum

ClipSum

PulseAugur coverage of ClipSum — every cluster mentioning ClipSum across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_29294 ·

    ClipSum框架使用CLIP改进指令视频摘要

    研究人员开发了ClipSum,一个利用CLIP的视觉语言特征来摘要指令视频的新框架。该方法使用CLIP的语义对齐视觉特征,CLIP在海量图文对数据集上进行训练,以弥合视觉理解与语言生成之间的差距。ClipSum在YouCook2数据集上的表现优于传统方法,在维度显著降低的情况下取得了更高的ROUGE-1分数,表明语义对齐比原始特征容量更重要。