PulseAugur
实时 10:05:29
English(EN) Bergson: An Open Source Library for Data Attribution

Bergson 库发布,用于机器学习中的开源数据归因

一个名为 Bergson 的新开源库已发布,旨在促进机器学习中的数据归因。该库旨在通过追溯模型行为对其训练数据的依赖来简化解释模型行为的过程。Bergson 为大型语言模型和预训练数据集提供了可扩展的技术,包括对分布式训练和磁盘上梯度存储的支持。它还提供了三种著名数据归因方法(MAGICSOURCETrackStar)的开源实现。 AI

影响 通过提供可扩展的数据归因工具,使研究人员能够更轻松地调试模型和整理训练数据集。

排序理由 这是一篇介绍机器学习中数据归因开源库的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Lucia Quirke, Louis Jaburi, David Johnston, William Z. Li, Gon\c{c}alo Paulo, Guillaume Martres, Girish Gupta, Stella Biderman, Nora Belrose ·

    Bergson: An Open Source Library for Data Attribution

    arXiv:2606.11660v1 Announce Type: new Abstract: Data attribution is a promising field in interpretability that aims to explain model behavior through the influence of its training data, with applications including debugging undesirable model behavior and training dataset curation…