实体
Pyrit
Pyrit
PulseAugur coverage of Pyrit — every cluster mentioning Pyrit across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的KYA框架增强了自主系统的信任和治理
研究人员推出KYA(Know Your Agents),一个开源的信任和治理层,专为自主系统设计。KYA旨在为操作员提供关于代理的正确性、策略遵守情况以及潜在的恶意行为的洞察,是对现有可观测性工具的补充。该框架被设计为对众多代理框架具有通用性,并包含可验证的来源和分层策略组合功能。
-
LLM 安全测试需要超越公共基准的自定义探测
测试 LLM 应用的安全漏洞至关重要,因为在公共基准上表现良好的模型在实际应用场景中可能会失败。这些失败可能源于提示格式漂移、上下文污染或允许模型绕过安全措施的工具/代理循环。开发人员应使用 Garak 或 PyRIT 等工具构建本地评估工具,并定义与其应用相关的特定威胁模型,以捕获特定领域的漏洞。