研究人员开发了 RedCoder,这是一种自动化代理,专为代码生成大语言模型 (LLM) 的多轮红队测试而设计。该代理与受害者模型进行对话交互,以识别漏洞和恶意代码生成。RedCoder 利用多代理博弈过程来制定攻击策略,并微调一个 LLM 来驱动这些对话,在引发代码漏洞方面优于之前的红队测试方法。 AI
影响 为评估代码生成 LLM 的安全性提供了一种可扩展的方法,有望带来更安全的 AI 辅助开发工具。
排序理由 该集群包含一篇详细介绍 AI 模型评估新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →