微软推出了 ASSERT,这是一个开源框架,旨在简化特定应用程序的 AI 系统的测试。ASSERT 将期望行为和策略的自然语言描述转化为结构化测试,生成场景并根据这些标准对 AI 的性能进行评分。该工具旨在确保 AI 系统遵守产品特定的规则和组织指南,并提供从开发到部署的持续评估。 AI
影响 实现了更强大、更具应用针对性的 AI 测试,可能加速 AI 在产品中的安全部署。
排序理由 这是来自一家主要科技公司的新产品发布,但它是一个用于测试 AI 的框架,而不是核心 AI 模型发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →