PulseAugur
实时 11:42:55
实体 Prefix failure

Prefix failure

PulseAugur coverage of Prefix failure — every cluster mentioning Prefix failure across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_79119 ·

    新的轨迹精炼蒸馏改进了LLM训练

    研究人员推出了一种新的方法——轨迹精炼蒸馏(TRD),以改进大型语言模型的训练后过程。TRD解决了在线蒸馏中的“前缀失败”问题,该问题会导致密集型逐令牌监督产生碎片化梯度。通过在蒸馏前对轨迹级别的学生模型回放进行校正,TRD缓解了这一问题并增强了探索。该方法在各种基准测试和模型规模上都显示出了一致的性能提升。