PulseAugur
实时 06:43:53
实体 kernel graph

kernel graph

PulseAugur coverage of kernel graph — every cluster mentioning kernel graph across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_115242 ·

    新的SMMD训练方法增强了LLM的数值精度

    研究人员开发了一种名为平滑最大均值差异(SMMD)的新训练目标,以提高大型语言模型(LLM)的数值精度。标准的交叉熵训练将数值标记视为类别,忽略了它们固有的值结构。SMMD通过引入值距离核和基于图的平滑性来解决这个问题,将预测分布与目标值对齐,并鼓励局部一致性。在数学推理和图表问答等任务上,对各种LLM和视觉语言模型骨干的评估表明,SMMD的性能始终优于现有方法。