English(EN) Beyond Log Likelihood: Probability-Based Objectives for Supervised Fine-Tuning across the Model Capability Continuum

新的SFT目标在有能力的LLM上优于NLL

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-25 04:00

研究人员探索了大型语言模型监督微调（SFT）的替代目标，超越了标准的负对数似然（NLL）。他们的研究通过在各种模型和基准上进行大量实验，揭示了不同的目标根据模型的性能表现更好。对于能力更强的模型，降低低概率token权重的目标更有效，而对于能力较弱的模型，NLL表现最佳。 AI

影响新的微调目标可以提高LLM的泛化能力和在特定任务上的性能。

排序理由该集群包含一篇学术论文，详细介绍了关于LLM微调目标的最新研究成果。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Gaotang Li, Ruizhong Qiu, Xiusi Chen, Heng Ji, Hanghang Tong · 2026-05-25 04:00

超越对数似然：模型能力连续体上的监督微调的基于概率的目标

arXiv:2510.00526v3 Announce Type: replace Abstract: Supervised fine-tuning (SFT) is the standard approach for post-training large language models (LLMs), yet it often shows limited generalization. We trace this limitation to its default training objective: negative log likelihood…