研究人员开发了块稀疏特征提取器(BSFs),它们可以更有效地捕获神经网络激活中视觉概念的几何结构。这些 BSF 将方向分组到块中,与一种生成模型对齐,在该模型中,表示是低维流形的稀疏和。研究表明,与基于方向的方法相比,BSF 更紧凑地描述了激活,识别出通常是二维到四维的概念。这些特征提取器已应用于重新解读 InceptionV1 上的先前工作,发现 DINOv3 中的阴影和光照等新流形,并通过流形引导实现对 SDXL 中图像生成的可解释控制。 AI
影响 引入了一种理解和控制 AI 模型中视觉概念表示的新颖方法。
排序理由 详细介绍分析神经网络表示新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →