PulseAugur
实时 11:46:02
实体 Outlier Gradient Masking

Outlier Gradient Masking

PulseAugur coverage of Outlier Gradient Masking — every cluster mentioning Outlier Gradient Masking across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_79617 ·

    新的SAR方法提高了LLM在几何任务中的精度

    研究人员开发了一种名为饱和加性奖励(SAR)的新方法,以提高大型语言模型在几何任务中的精度。该方法解决了称为异常梯度掩蔽(Outlier Gradient Masking)的故障模式,在这种模式下,单个约束违反会阻碍所有约束的学习。SAR将奖励分解为有界的每约束项,保留部分进展并确保梯度一致性。使用SAR的8B参数模型在解决复杂几何问题方面比标准的基于MSE的奖励提高了2.3倍。