English(EN) DB-KSVD: Scalable Alternating Optimization for Disentangling High-Dimensional Embedding Spaces

DB-KSVD算法为解耦高维嵌入空间提供了可扩展的方法

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-30 04:00

研究人员推出了一种新颖的字典学习算法DB-KSVD，旨在解耦大型Transformer模型中的高维嵌入空间。该方法将经典的KSVD算法改编为可高效扩展以处理数百万样本和数千个维度。在Gemma-2-2B和Pythia-160M模型的文本嵌入以及DINOv2模型的图像嵌入上，DB-KSVD的性能与稀疏自编码器相比具有竞争力，这表明传统的优化方法可以有效地扩展以用于可解释性任务。 AI

影响为Transformer模型的可解释性提供了稀疏自编码器的一种可扩展替代方案，有望增进对模型机制的理解。

排序理由这是一篇介绍解耦嵌入空间新算法的研究论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Romeo Valentin, Sydney M. Katz, Vincent Vanhoucke, Mykel J. Kochenderfer · 2026-04-30 04:00

DB-KSVD：用于解耦高维嵌入空间的可扩展交替优化

arXiv:2505.18441v2 Announce Type: replace Abstract: Dictionary learning has recently emerged as a promising approach for mechanistic interpretability of large transformer models. Disentangling high-dimensional transformer embeddings requires algorithms that scale to high-dimensio…

报道来源 [1]

DB-KSVD：用于解耦高维嵌入空间的可扩展交替优化

相关实体

相关话题