PulseAugur
实时 14:18:20
实体 PuzzleZoo-775

PuzzleZoo-775

PulseAugur coverage of PuzzleZoo-775 — every cluster mentioning PuzzleZoo-775 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_58554 ·

    RePoT 通过检查点恢复增强 LLM 规划能力

    研究人员推出 RePoT,一种提高大型语言模型思路程序(PoT)可靠性的方法。RePoT 解决了生成计划中单个无效步骤可能导致整个序列失效的问题。通过将计划视为一系列检查点,RePoT 可以从最后一个有效步骤恢复执行,只需最少的额外 LLM 调用,从而提高了 PuzzleZoo-775 和 PlanBench Blocksworld 等基准测试的成功率。这种方法显示出显著的收益,尤其与仅错误反馈相比,突显了检查点信息对于恢复的重要性。