实体 Visual Implicit Reasoning Diagnosing Benchmark

Visual Implicit Reasoning Diagnosing Benchmark

PulseAugur coverage of Visual Implicit Reasoning Diagnosing Benchmark — every cluster mentioning Visual Implicit Reasoning Diagnosing Benchmark across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_93885 · Jun 16 · 04:00

论文：视觉语言模型在推理中缺乏能动性

一篇新论文认为，当前的视觉语言模型（VLMs）存在系统性的能动性缺失，阻碍了它们的隐式推理能力。作者提出，VLMs倾向于执行被动的语义检索，而不是人类视觉理解所必需的主动、情境化推理。为解决此问题，他们引入了视觉隐式推理诊断基准（V-IRD）来衡量这一缺失的象限，发现即使是主流的VLMs在自主视觉探索和关注自我导向的探究方面也存在困难。

论文：视觉语言模型在推理中缺乏能动性