PulseAugur
实时 12:33:41
实体 Visual Implicit Reasoning Diagnosing Benchmark

Visual Implicit Reasoning Diagnosing Benchmark

PulseAugur coverage of Visual Implicit Reasoning Diagnosing Benchmark — every cluster mentioning Visual Implicit Reasoning Diagnosing Benchmark across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_93885 ·

    论文:视觉语言模型在推理中缺乏能动性

    一篇新论文认为,当前的视觉语言模型(VLMs)存在系统性的能动性缺失,阻碍了它们的隐式推理能力。作者提出,VLMs倾向于执行被动的语义检索,而不是人类视觉理解所必需的主动、情境化推理。为解决此问题,他们引入了视觉隐式推理诊断基准(V-IRD)来衡量这一缺失的象限,发现即使是主流的VLMs在自主视觉探索和关注自我导向的探究方面也存在困难。