PulseAugur
实时 22:39:26
English(EN) CHASD: Language Increment-Calibrated Contrastive Decoding against Hallucination in LVLMs

新的解码方法解决了视觉语言模型中的幻觉问题

研究人员开发了一种名为 CHASd 的新推理时框架,以对抗大型视觉语言模型 (LVLMs) 中的幻觉。该方法,即对比幻觉感知分步解码,仅在 token 预测置信度低时选择性地激活对比解码分支。它使用由注意力引导的局部视觉扰动来最小化对有用视觉证据的干扰,在多个基准测试上提高了幻觉指标,同时保持了高效的推理。 AI

影响 减少了视觉语言模型中的对象幻觉,提高了多模态 AI 应用的可靠性。

排序理由 该集群包含一篇详细介绍改进 AI 模型新方法的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Xiaoyi Huang, Kejia Zhang, Zhiming Luo ·

    CHASD: Language Increment-Calibrated Contrastive Decoding against Hallucination in LVLMs

    arXiv:2605.23344v1 Announce Type: cross Abstract: Large Vision-Language Models have shown strong multimodal reasoning capabilities, yet they remain susceptible to object hallucinations when language priors dominate insufficient or misaligned visual evidence. Training-free contras…

  2. arXiv cs.CV TIER_1 English(EN) · Zhiming Luo ·

    CHASD: Language Increment-Calibrated Contrastive Decoding against Hallucination in LVLMs

    Large Vision-Language Models have shown strong multimodal reasoning capabilities, yet they remain susceptible to object hallucinations when language priors dominate insufficient or misaligned visual evidence. Training-free contrastive decoding methods mitigate this issue by compa…