PulseAugur
实时 13:46:53
实体 ICPC-Eval

ICPC-Eval

PulseAugur coverage of ICPC-Eval — every cluster mentioning ICPC-Eval across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_51241 ·

    CP-Agent 通过反馈提升 LLM 在竞争性编程中的成功率

    研究人员开发了 CP-Agent,一个旨在提高大型语言模型在竞争性编程任务中性能的新系统。该代理利用校准停止过程模型来有效整合执行反馈,重点在于减少错误接纳并增加对错误程序的证据。通过实施双粒度验证和测试增强等机制,CP-Agent 在 LiveCodeBench Pro 和 ICPC-Eval 等基准测试中显著提高了成功率,而无需更新模型参数。