English(EN) VAUQ: Vision-Aware Uncertainty Quantification for LVLM Self-Evaluation

VAUQ框架通过衡量视觉证据依赖性来增强LVLM的自评估能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了VAUQ，一个旨在提高大型视觉语言模型（LVLM）自评估能力的新框架。该方法通过明确衡量模型对视觉证据的依赖性来解决LVLM产生幻觉的倾向，这与以往以语言为中心的模型不同。VAUQ引入了图像信息得分和核心区域遮蔽策略，以更好地反映LVLM输出的正确性，并在自评估技术方面表现优于现有方法。 AI

影响通过提高视觉语言模型自我评估输出的能力，增强了其可靠性，有望带来更安全的实际应用。

排序理由这是一篇发表在arXiv上的研究论文，详细介绍了一个用于评估LVLM的新框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Seongheon Park, Changdae Oh, Hyeong Kyu Choi, Sean Du, Sharon Li · 2026-05-05 04:00

VAUQ：用于 LVLM 自我评估的视觉感知不确定性量化

arXiv:2602.21054v2 Announce Type: replace Abstract: Large Vision-Language Models (LVLMs) frequently hallucinate, limiting their safe deployment in real-world applications. Existing LLM self-evaluation methods rely on a model's ability to estimate the correctness of its own output…

报道来源 [1]

VAUQ：用于 LVLM 自我评估的视觉感知不确定性量化

相关实体

相关话题