PulseAugur
实时 04:56:41
实体 NL-PDDL-Bench

NL-PDDL-Bench

PulseAugur coverage of NL-PDDL-Bench — every cluster mentioning NL-PDDL-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_117493 ·

    新基准改进了规划系统的LLM形式化

    研究人员开发了NL-PDDL-Bench,这是一个旨在改进大型语言模型(LLM)形式化为规划领域定义语言(PDDL)的新基准,用于自主系统。该基准包括一个使用规划器诊断来修改不可执行规范的框架,以及一个用于微调LLM的基于规划器的优化方法。实验表明,规划器成功率和规划级别的一致性得到了显著提高,从而增强了LLM在安全关键规划应用中的可靠性。