PulseAugur
实时 02:21:00
English(EN) Beyond Log Likelihood: Probability-Based Objectives for Supervised Fine-Tuning across the Model Capability Continuum

新的SFT目标在有能力的LLM上优于NLL

研究人员探索了大型语言模型监督微调(SFT)的替代目标,超越了标准的负对数似然(NLL)。他们的研究通过在各种模型和基准上进行大量实验,揭示了不同的目标根据模型的性能表现更好。对于能力更强的模型,降低低概率token权重的目标更有效,而对于能力较弱的模型,NLL表现最佳。 AI

影响 新的微调目标可以提高LLM的泛化能力和在特定任务上的性能。

排序理由 该集群包含一篇学术论文,详细介绍了关于LLM微调目标的最新研究成果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Gaotang Li, Ruizhong Qiu, Xiusi Chen, Heng Ji, Hanghang Tong ·

    超越对数似然:模型能力连续体上的监督微调的基于概率的目标

    arXiv:2510.00526v3 Announce Type: replace Abstract: Supervised fine-tuning (SFT) is the standard approach for post-training large language models (LLMs), yet it often shows limited generalization. We trace this limitation to its default training objective: negative log likelihood…