研究人员开发了一种名为奇异值集成(SVE)的新方法,可以更有效地量化基础模型的不确定性。使用独立训练模型的集成方法对于大型模型来说计算成本很高。然而,SVE冻结了权重矩阵的奇异向量,并且仅训练每个成员的奇异值,从而以不到1%的参数数量增加有效地创建了一个集成。这种方法提高了模型校准,并保持了在各种NLP和视觉任务中的预测准确性。 AI
影响 提供了一种计算高效的方法来估计大型基础模型的不确定性,提高了下游应用的可靠性。
排序理由 该集群包含一篇详细介绍量化模型不确定性新方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →