研究人员开发了一个名为Tree Self-Play (TSP) 的新颖框架,以解决在代码上训练的大型语言模型中固有的安全漏洞。当前的监督微调和强化学习等方法过于粗粒度,无法修复导致SQL注入等问题的局部编码错误。TSP引入了一种细粒度的、自主的方法,能够精确识别代码中的风险节点,并利用自我博弈生成安全和易受攻击的代码路径,以进行有针对性的优化。 AI
影响 该框架可以显著提高AI生成代码的安全性,减少漏洞,并增强对AI辅助软件开发的信任。
排序理由 该集群描述了一篇关于AI代码模型新训练框架的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
- CodeLlama-7B
- DiverseVul
- HumanEval
- Large language models
- Qwen2.5-Coder-3B
- Qwen2.5-Coder-7B
- Reinforcement learning
- Supervised fine-tuning
- Tree Self-Play
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →