PulseAugur
实时 08:41:16
English(EN) SkillFuzz: Fuzzing Skill Composition for Implicit Intents Discovery in Open Skill Marketplaces

新的模糊测试技术发现超过 1,000 个意外的 LLM 代理意图

研究人员开发了一种名为 SkillFuzz 的新方法,用于识别大型语言模型 (LLM) 代理中由多个技能组合可能产生的意外目标或“隐式意图”。该方法将技能组合发现视为一个模糊测试问题,利用规划伪影在执行前暴露代理意图,并使用无技能基线作为预言机。SkillFuzz 采用蒙特卡洛树搜索来优先处理潜在冲突的技能组合,成功发现了超过 1,000 个不同的隐式意图,并验证了高比例的高风险组合。 AI

影响 这项研究通过在部署前识别潜在的意外行为,有可能提高 LLM 代理的安全性和可靠性。

排序理由 该集群包含一篇详细介绍 LLM 代理新测试方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的模糊测试技术发现超过 1,000 个意外的 LLM 代理意图

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Jinwei Hu, Yi Dong, Youcheng Sun, Xiaowei Huang ·

    SkillFuzz: Fuzzing Skill Composition for Implicit Intents Discovery in Open Skill Marketplaces

    arXiv:2607.02345v1 Announce Type: cross Abstract: Large Language Model (LLM)-based agents increasingly automate software engineering tasks through reusable skills, natural-language instruction documents that guide planning and execution. Open skill marketplaces enable users to as…