PulseAugur
实时 01:00:57
实体 VL-LCM

VL-LCM

PulseAugur coverage of VL-LCM — every cluster mentioning VL-LCM across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_22498 ·

    新度量可在无标注情况下评估多模态大语言模型的逻辑一致性

    研究人员引入了一种新度量 VL-LCM,可在无需真实标注的情况下评估多模态大语言模型(MLLMs)的逻辑一致性。该度量使用 MMMU 和 NaturalBench 等现有基准,评估 MLLMs 在视觉-语言任务上的因果推理能力。对 11 个开源 MLLMs 的实验表明,尽管准确性有所提高,但逻辑一致性仍然是一个重大挑战,这表明 VL-LCM 可用于辅助模型选择和新任务验证。