一项针对 Gemma 3 4B 模型的研究,探讨了提高其回应言语自信度的方法。最初尝试使用过滤后的数据集进行置信度条件监督微调(CSFT)未能奏效,反而降低了性能。然而,一种移除过滤器并在所有校准项上进行训练的探索性方法,显著提高了模型预测言语正确性的能力,在 TriviaQA 上达到了 0.774 的 AUROC2。 AI
影响 展示了一种提高小型 LLM 置信度校准的潜在方法,影响其在下游应用的可靠性。
排序理由 这是一篇详细介绍特定模型性能实验结果的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →