Anthropic 推出了 Claude 合规性 API,旨在帮助组织检测其 AI 模型的使用滥用情况。该 API 提供一个可与安全信息和事件管理 (SIEM) 系统集成的源,以识别与访问和身份管理 (IAM) 相关的问 题。开发人员还创建了一个包含预过滤器和 LLM 裁判的管道,以捕获消息内容中更复杂的威胁,例如提示注入和数据泄露,并提供用于离线分析的存储库和 Sigma 规则。 AI
影响 为企业提供了监控和保护 AI 模型使用免受复杂威胁的工具。
排序理由 这是关于合规性 API 的产品公告,而不是新的模型发布或核心研究。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →