研究人员开发了一种名为模型感知对比解码(MACD)的新推理策略,以解决视频语言模型中的幻觉问题。MACD利用模型自身的反馈来识别和定位导致生成无根据内容的特定对象区域。通过创建针对这些问题区域的反事实输入,MACD在解码过程中强制执行基于证据的标记选择,从而减少幻觉并提高在各种基准测试上的准确性。 AI
影响 该方法可以提高视频理解模型的可靠性,减少虚假信息的生成。
排序理由 详细介绍一种提高Video-LLM性能的新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →