PulseAugur
实时 23:40:18
English(EN) DB-KSVD: Scalable Alternating Optimization for Disentangling High-Dimensional Embedding Spaces

DB-KSVD算法为解耦高维嵌入空间提供了可扩展的方法

研究人员推出了一种新颖的字典学习算法DB-KSVD,旨在解耦大型Transformer模型中的高维嵌入空间。该方法将经典的KSVD算法改编为可高效扩展以处理数百万样本和数千个维度。在Gemma-2-2B和Pythia-160M模型的文本嵌入以及DINOv2模型的图像嵌入上,DB-KSVD的性能与稀疏自编码器相比具有竞争力,这表明传统的优化方法可以有效地扩展以用于可解释性任务。 AI

影响 为Transformer模型的可解释性提供了稀疏自编码器的一种可扩展替代方案,有望增进对模型机制的理解。

排序理由 这是一篇介绍解耦嵌入空间新算法的研究论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

DB-KSVD算法为解耦高维嵌入空间提供了可扩展的方法

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Romeo Valentin, Sydney M. Katz, Vincent Vanhoucke, Mykel J. Kochenderfer ·

    DB-KSVD: Scalable Alternating Optimization for Disentangling High-Dimensional Embedding Spaces

    arXiv:2505.18441v2 Announce Type: replace Abstract: Dictionary learning has recently emerged as a promising approach for mechanistic interpretability of large transformer models. Disentangling high-dimensional transformer embeddings requires algorithms that scale to high-dimensio…