一篇新发表在arXiv上的研究论文引入了视觉模型中的“视觉转喻”概念,即物体的局部编码了关于整个物体的信息。这种现象破坏了基于注意力的可解释性方法,这些方法假设局部性,即局部信息只应编码其对应的图像区域的信息。研究表明,现代视觉 Transformer 违反了这一假设,使得基于局部的推理和可解释性技术不可靠。 AI
影响 突出了视觉模型可解释性中的一个根本性问题,可能需要新的方法来理解模型行为。
排序理由 该集群包含一篇研究论文,详细介绍了关于视觉模型可解释性的新发现。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →