PulseAugur
实时 10:30:19
实体 SuperGPQA

SuperGPQA

PulseAugur coverage of SuperGPQA — every cluster mentioning SuperGPQA across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_79471 ·

    INFUSER框架通过引导式自我进化提升LLM推理能力

    研究人员开发了INFUSER,一个用于自我进化语言模型的新框架,可增强推理能力。该迭代式协同训练系统包含一个生成器(Generator),用于从文档中生成问题和答案,以及一个从中学习的求解器(Solver)。生成器根据影响分数(influence score)获得奖励,确保它生成真正能提升求解器性能的问题,而非仅仅是难题。INFUSER展示了显著的改进,一个8B模型在数学和编码任务上的表现优于一个更大的32B模型。