PulseAugur
实时 21:19:10
实体 LLaVA-1.5

LLaVA-1.5

PulseAugur coverage of LLaVA-1.5 — every cluster mentioning LLaVA-1.5 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_02088 ·

    VG-CoT: 通过基于实证的思维链实现可信赖的视觉推理

    研究人员推出了VG-CoT,这是一个旨在提高大型视觉语言模型(LVLM)可信度的新数据集。该数据集可自动将推理步骤与图像中的特定视觉证据联系起来,克服了现有需要大量手动标注的数据集的局限性。VG-CoT还包括一个基准,用于评估LVLM在推理质量、答案准确性和推理-答案一致性方面的表现,初步实验显示LLaVA-1.5和Qwen2-VL等模型有所改进。