English(EN) The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes

新假说提出高效的大模型数据影响估计方法

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员提出了镜像影响假说（Mirrored Influence Hypothesis），该假说表明，理解训练数据对模型预测的影响可以通过反向计算来评估在测试数据上训练将如何改变训练样本的预测。这种新方法通过计算测试样本的梯度和训练点的前向传播，与现有方法相比，提供了显著的效率提升，尤其是在测试数据集远小于训练数据集的情况下。该方法已在扩散模型的数据归因、检测数据泄露和错误标记数据以及分析语言模型的记忆和行为等领域展示了其适用性。 AI

影响提供了一种更有效的方法来理解数据影响，可能提高模型的可靠性，并有助于数据泄露检测等任务。

排序理由这是一篇详细介绍机器学习模型中影响估计新假说和方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv stat.ML TIER_1 English(EN) · Myeongseob Ko, Feiyang Kang, Weiyan Shi, Ming Jin, Zhou Yu, Ruoxi Jia · 2026-06-09 04:00

镜像影响假说：通过利用前向传播进行高效数据影响估计

arXiv:2402.08922v3 Announce Type: replace-cross Abstract: Large-scale black-box models have become ubiquitous across numerous applications. Understanding the influence of individual training data sources on predictions made by these models is crucial for improving their trustwort…

报道来源 [1]

镜像影响假说：通过利用前向传播进行高效数据影响估计

相关实体

相关话题