PulseAugur
实时 13:51:32
Deutsch(DE) Seit zwei Jahren hängt die Security-Pass-Rate von LLM-Code bei ~55 % fest. GPT-5, Gemini 3, Claude 4, ... In fast jeder zweiten Aufgabe baut das Modell eine bek

尽管有新模型,LLM代码安全通过率仍停滞在55%

尽管GPT-5.5、Gemini 3和Claude 4等模型取得了进展,但两年多来,LLM生成代码的安全通过率一直停滞在约55%。这些模型在处理的任务中近一半会引入已知的安全漏洞,尽管它们的语法正确性很高。虽然LLM可以提高编码速度,但它们本身并不能提高交付软件的安全性。 AI

影响 LLM生成的代码持续引入安全漏洞,表明需要改进安全实践和工具,而不仅仅是代码生成。

排序理由 该项目讨论了关于LLM生成代码安全通过率的研究发现,引用了一个特定的基准,并提到了多个LLM模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 Mastodon — fosstodon.org 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

尽管有新模型,LLM代码安全通过率仍停滞在55%

报道来源 [1]

  1. Mastodon — fosstodon.org TIER_1 Deutsch(DE) · [email protected] ·

    For two years, the security pass rate of LLM code has been stuck at ~55%. GPT-5.5, Gemini 3, Claude 4, ... In almost every second task, the model builds a vulnerability

    Seit zwei Jahren hängt die Security-Pass-Rate von LLM-Code bei ~55 % fest. GPT-5, Gemini 3, Claude 4, ... In fast jeder zweiten Aufgabe baut das Modell eine bekannte Sicherheitslücke ein. Syntaktisch sind sie quasi perfekt (>95 %). Sicher werden sie nicht. LLMs macht dein Team sc…