PulseAugur
实时 21:10:22
实体 test-time scaling

test-time scaling

PulseAugur coverage of test-time scaling — every cluster mentioning test-time scaling across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_50874 ·

    随机回溯提升语言模型推理效率

    研究人员开发了一种名为随机回溯的新方法,以提高语言模型在测试时扩展的效率。该技术允许模型重新访问先前生成的状体,而不是仅仅扩展当前解决方案的前沿。通过采用子池选择和结合序列蒙特卡洛方法的增强回溯,该方法旨在提高准确性,同时减少推理过程中生成的总令牌数。在数学推理基准上的实验表明,与现有方法相比,每令牌的准确性有所提高。