一个名为 Bergson 的新开源库已发布,旨在促进机器学习中的数据归因。该库旨在通过追溯模型行为对其训练数据的依赖来简化解释模型行为的过程。Bergson 为大型语言模型和预训练数据集提供了可扩展的技术,包括对分布式训练和磁盘上梯度存储的支持。它还提供了三种著名数据归因方法(MAGIC、SOURCE 和 TrackStar)的开源实现。 AI
影响 通过提供可扩展的数据归因工具,使研究人员能够更轻松地调试模型和整理训练数据集。
排序理由 这是一篇介绍机器学习中数据归因开源库的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →