English(EN) SkillFuzz: Fuzzing Skill Composition for Implicit Intents Discovery in Open Skill Marketplaces

新的模糊测试技术发现超过 1,000 个意外的 LLM 代理意图

作者 PulseAugur 编辑部 · [1 个来源] · 2026-07-03 04:00

研究人员开发了一种名为 SkillFuzz 的新方法，用于识别大型语言模型 (LLM) 代理中由多个技能组合可能产生的意外目标或“隐式意图”。该方法将技能组合发现视为一个模糊测试问题，利用规划伪影在执行前暴露代理意图，并使用无技能基线作为预言机。SkillFuzz 采用蒙特卡洛树搜索来优先处理潜在冲突的技能组合，成功发现了超过 1,000 个不同的隐式意图，并验证了高比例的高风险组合。 AI

影响这项研究通过在部署前识别潜在的意外行为，有可能提高 LLM 代理的安全性和可靠性。

排序理由该集群包含一篇详细介绍 LLM 代理新测试方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Jinwei Hu, Yi Dong, Youcheng Sun, Xiaowei Huang · 2026-07-03 04:00

SkillFuzz: Fuzzing Skill Composition for Implicit Intents Discovery in Open Skill Marketplaces

arXiv:2607.02345v1 Announce Type: cross Abstract: Large Language Model (LLM)-based agents increasingly automate software engineering tasks through reusable skills, natural-language instruction documents that guide planning and execution. Open skill marketplaces enable users to as…

报道来源 [1]

SkillFuzz: Fuzzing Skill Composition for Implicit Intents Discovery in Open Skill Marketplaces

相关实体

相关话题