研究人员开发了一个名为WARP的新框架,可以直接从基础模型发布的权重中推断出其使用的训练数据组合。该方法绕过了对训练数据或训练轨迹的直接访问需求,而这些通常由模型开发者保密。WARP通过分析权重空间中训练数据的几何足迹来工作,能够以高精度近似领域比例,其表现优于现有的成员推断等方法。 AI
影响 增强了基础模型训练的透明度,可能有助于复现性和偏差检测。
排序理由 该集群包含一篇学术论文,详细介绍了用于分析基础模型的新研究框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →