PulseAugur
实时 15:27:41

新的“Poison-with-Style”攻击以微妙的触发器为目标,攻击代码LLM

研究人员开发了一种名为Poison-with-Style (PwS) 的新型数据投毒攻击,该攻击以代码大型语言模型 (CLLM) 为目标。该攻击巧妙地将触发代码风格嵌入开发者的提示中,导致CLLM在没有明确触发词的情况下生成易受攻击的代码。PwS在对抗现有防御措施方面表现出鲁棒性,并在生成特定漏洞(如CWE-20)方面取得了高成功率,同时对标准代码补全基准测试的性能影响最小。 AI

影响 这项研究突显了代码LLM的新漏洞,可能影响AI辅助软件开发的安全性。

排序理由 该集群包含一篇详细介绍针对代码LLM的新型攻击方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的“Poison-with-Style”攻击以微妙的触发器为目标,攻击代码LLM

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Khang Tran, Yazan Boshmaf, Issa Khalil, NhatHai Phan, Ting Yu, Md Rizwan Parvez ·

    风格化的投毒:一种针对代码大语言模型的实用投毒攻击

    arXiv:2605.27631v1 Announce Type: cross Abstract: Code Large Language Models (CLLMs) serve as the core of modern code agents, enabling developers to automate complex software development tasks. In this paper, we present Poison-with-Style (PwS), a practical and stealthy model pois…