Deutsch(DE) Seit zwei Jahren hängt die Security-Pass-Rate von LLM-Code bei ~55 % fest. GPT-5, Gemini 3, Claude 4, ... In fast jeder zweiten Aufgabe baut das Modell eine bek

尽管有新模型，LLM代码安全通过率仍停滞在55%

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-21 11:52

尽管GPT-5.5、Gemini 3和Claude 4等模型取得了进展，但两年多来，LLM生成代码的安全通过率一直停滞在约55%。这些模型在处理的任务中近一半会引入已知的安全漏洞，尽管它们的语法正确性很高。虽然LLM可以提高编码速度，但它们本身并不能提高交付软件的安全性。 AI

影响 LLM生成的代码持续引入安全漏洞，表明需要改进安全实践和工具，而不仅仅是代码生成。

排序理由该项目讨论了关于LLM生成代码安全通过率的研究发现，引用了一个特定的基准，并提到了多个LLM模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 Mastodon — fosstodon.org 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Mastodon — fosstodon.org TIER_1 Deutsch(DE) · [email protected] · 2026-06-21 11:52

For two years, the security pass rate of LLM code has been stuck at ~55%. GPT-5.5, Gemini 3, Claude 4, ... In almost every second task, the model builds a vulnerability

Seit zwei Jahren hängt die Security-Pass-Rate von LLM-Code bei ~55 % fest. GPT-5, Gemini 3, Claude 4, ... In fast jeder zweiten Aufgabe baut das Modell eine bekannte Sicherheitslücke ein. Syntaktisch sind sie quasi perfekt (>95 %). Sicher werden sie nicht. LLMs macht dein Team sc…

链接 veracode.com/…/spring-2026-genai-code-sec…

报道来源 [1]

For two years, the security pass rate of LLM code has been stuck at ~55%. GPT-5.5, Gemini 3, Claude 4, ... In almost every second task, the model builds a vulnerability

相关实体

相关话题