English(EN) RedCoder: Automated Multi-Turn Red Teaming for Code LLMs

RedCoder 代理自动化代码大语言模型的红队测试

作者 PulseAugur 编辑部 · [1 个来源] · 2026-07-03 04:00

研究人员开发了 RedCoder，这是一种自动化代理，专为代码生成大语言模型 (LLM) 的多轮红队测试而设计。该代理与受害者模型进行对话交互，以识别漏洞和恶意代码生成。RedCoder 利用多代理博弈过程来制定攻击策略，并微调一个 LLM 来驱动这些对话，在引发代码漏洞方面优于之前的红队测试方法。 AI

影响为评估代码生成 LLM 的安全性提供了一种可扩展的方法，有望带来更安全的 AI 辅助开发工具。

排序理由该集群包含一篇详细介绍 AI 模型评估新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Wenjie Jacky Mo, Qin Liu, Xiaofei Wen, Dongwon Jung, Hadi Askari, Wenxuan Zhou, Zhe Zhao, Muhao Chen · 2026-07-03 04:00

RedCoder: Automated Multi-Turn Red Teaming for Code LLMs

arXiv:2507.22063v2 Announce Type: replace-cross Abstract: Large Language Models (LLMs) for code generation (i.e., Code LLMs) have demonstrated impressive capabilities in AI-assisted software development and testing. However, recent studies have shown that these models are prone t…

报道来源 [1]

RedCoder: Automated Multi-Turn Red Teaming for Code LLMs

相关实体

相关话题