PulseAugur
实时 06:45:59
实体 Gaotang Li

Gaotang Li

PulseAugur coverage of Gaotang Li — every cluster mentioning Gaotang Li across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_48874 ·

    新的SFT目标在有能力的LLM上优于NLL

    研究人员探索了大型语言模型监督微调(SFT)的替代目标,超越了标准的负对数似然(NLL)。他们的研究通过在各种模型和基准上进行大量实验,揭示了不同的目标根据模型的性能表现更好。对于能力更强的模型,降低低概率token权重的目标更有效,而对于能力较弱的模型,NLL表现最佳。