PulseAugur
实时 04:39:43
实体 WizardMath

WizardMath

PulseAugur coverage of WizardMath — every cluster mentioning WizardMath across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_111725 ·

    新方法使用错误草稿来提升LLM的数学能力

    研究人员开发了一种名为“通过不匹配的错误草稿进行弱到强诱导”的新颖技术,以提高大型语言模型的能力。该方法涉及使用来自较小的、特定领域的模型的数学上不正确的草稿来训练一个更大的模型,其性能优于标准的强化学习微调。该技术在MATH-500和分布外AIME 2025/2026基准测试中显示出显著的提升,为Mathstral-7B模型实现了新的最先进水平。