PulseAugur
实时 04:41:49
实体 NL-Refer

NL-Refer

PulseAugur coverage of NL-Refer — every cluster mentioning NL-Refer across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_37970 ·

    新的训练策略使视频视觉和语言对齐,以实现物体理解

    研究人员推出了一种名为SWIM的新训练策略,旨在仅使用文本提示来对齐视频中的视觉和语言表示,以实现详细的物体理解。该方法解决了多模态模型中物体名词产生的视觉注意力模式与属性词不同,导致注意力分散的已知差异。通过使用名为NL-Refer的数据集并强制与地面真实掩码的空间一致性,SWIM旨在改善文本-视觉对齐,并优于现有的基于视觉提示的技术。