一项新的 arXiv 研究调查了大型语言模型(LLMs)在生成代码时的安全校准问题。研究人员评估了 GPT-4o-mini、Gemini-2.0 Flash 和 Qwen3-Coder-Next,发现这些模型经常表现出过度自信,对不安全的代码赋予高置信度。研究还探讨了校准引导的自动化修复,发现在不引入功能回归的情况下修复漏洞方面效果有限。诸如架构门控之类的缓解策略在受控基准测试中提高了校准度,但在实际代码库环境中效果不佳,增加了高置信度漏洞输出的风险。 AI
影响 强调了使用 LLMs 进行安全关键代码生成所带来的潜在风险,以及改进校准的必要性。
排序理由 关于 LLM 安全校准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →