PulseAugur
实时 11:28:26
English(EN) Similarity-Distance-Magnitude Activations

新的SDM激活函数增强了LLM的可解释性和鲁棒性

研究人员引入了一种名为相似性-距离-幅度(SDM)的新激活函数。该函数旨在通过引入对相似性的感知来纠正预测、与训练分布的距离以及现有输出幅度,从而改进标准的softmax。基于此激活函数的SDM估计器旨在提高可解释性,并增强对分布变化的鲁棒性,特别是在预训练语言模型的选择性分类任务中。 AI

影响 引入了一种新颖的激活函数,可以提高大型语言模型的可解释性和鲁棒性。

排序理由 这是一篇详细介绍机器学习模型新激活函数的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Allen Schmaltz ·

    相似度-距离-幅度激活

    arXiv:2509.12760v5 Announce Type: replace Abstract: We introduce the Similarity-Distance-Magnitude (SDM) activation function, a more robust and interpretable formulation of the standard softmax activation function, adding Similarity (i.e., correctly predicted depth-matches into t…