研究人员开发了一种名为 CHASd 的新推理时框架,以对抗大型视觉语言模型 (LVLMs) 中的幻觉。该方法,即对比幻觉感知分步解码,仅在 token 预测置信度低时选择性地激活对比解码分支。它使用由注意力引导的局部视觉扰动来最小化对有用视觉证据的干扰,在多个基准测试上提高了幻觉指标,同时保持了高效的推理。 AI
影响 减少了视觉语言模型中的对象幻觉,提高了多模态 AI 应用的可靠性。
排序理由 该集群包含一篇详细介绍改进 AI 模型新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →