CoSPlay框架通过自我博弈增强LLM代码生成能力

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-22 10:53

研究人员开发了CoSPlay，一个无需依赖真实单元测试即可改进LLM代码生成的新框架。这种无需训练的方法使用合作式自我博弈来迭代地完善生成的代码及其关联的单元测试。通过分析执行信号，CoSPlay能够修剪弱代码并刷新不可靠的测试，从而显著提高代码生成准确性和测试质量。 AI

影响该框架为竞争性代码生成提供了一种可扩展的推理策略，有可能减少对昂贵真实数据的依赖。

排序理由发布了一篇详细介绍LLM代码生成新框架的研究论文。

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Zhangyi Hu, Chenhui Liu, Tian Huang, Jindong Li, Yang Yang, Jiemin Wu, Zining Zhong, Menglin Yang, Yutao Yue · 2026-05-25 04:00

CoSPlay: 测试时通过自生成代码和单元测试进行协作式自我对抗

arXiv:2605.23491v1 Announce Type: cross Abstract: Recently, Reinforcement Learning with Verifiable Rewards (RLVR) and Test-Time Scaling (TTS) have advanced LLM code generation through executable verification. Yet Ground-Truth Unit Tests (GT UTs) remain a bottleneck: SOTA RLVR met…
arXiv cs.AI TIER_1 English(EN) · Yutao Yue · 2026-05-22 10:53

CoSPlay: 测试时通过自生成代码和单元测试进行协同自玩

Recently, Reinforcement Learning with Verifiable Rewards (RLVR) and Test-Time Scaling (TTS) have advanced LLM code generation through executable verification. Yet Ground-Truth Unit Tests (GT UTs) remain a bottleneck: SOTA RLVR methods require them for costly training, while exist…