PulseAugur
实时 01:09:37
实体 Reasoning-Trace Collapse

Reasoning-Trace Collapse

PulseAugur coverage of Reasoning-Trace Collapse — every cluster mentioning Reasoning-Trace Collapse across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_38324 ·

    新研究解决大型语言模型中的推理退化和效率问题

    两篇新研究论文探讨了在大型语言模型中保持推理过程完整性的方法。第一篇论文《Reasoning-Trace Collapse》指出,即使最终答案正确,在标准指令-响应数据上进行微调也会导致显式推理痕迹退化。该论文提出了一种结构化评估框架来评估推理的可靠性,并提出了损失掩码策略来缓解这种退化。第二篇论文《Stop When Reasoning Converges》引入了 PUMA 框架,该框架可以检测推理步骤中的语义冗余,从而实现提前退出…