PulseAugur
实时 09:54:42
实体 SkillFuzz

SkillFuzz

PulseAugur coverage of SkillFuzz — every cluster mentioning SkillFuzz across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_123089 ·

    新的模糊测试技术发现超过 1,000 个意外的 LLM 代理意图

    研究人员开发了一种名为 SkillFuzz 的新方法,用于识别大型语言模型 (LLM) 代理中由多个技能组合可能产生的意外目标或“隐式意图”。该方法将技能组合发现视为一个模糊测试问题,在执行前使用规划产物来暴露代理意图,并使用无技能基线作为预言机。SkillFuzz 采用蒙特卡洛树搜索来优先处理潜在冲突的技能组合,成功发现了超过 1,000 个不同的隐式意图,并验证了高比例的高风险组合。