PulseAugur
实时 20:08:01
English(EN) New Microsoft tool lets devs spin up AI behavior tests using text descriptions

微软推出 ASSERT 用于应用程序特定的 AI 行为测试

微软推出了 ASSERT,这是一个开源框架,旨在简化特定应用程序的 AI 系统的测试。ASSERT 将期望行为和策略的自然语言描述转化为结构化测试,生成场景并根据这些标准对 AI 的性能进行评分。该工具旨在确保 AI 系统遵守产品特定的规则和组织指南,并提供从开发到部署的持续评估。 AI

影响 实现了更强大、更具应用针对性的 AI 测试,可能加速 AI 在产品中的安全部署。

排序理由 这是来自一家主要科技公司的新产品发布,但它是一个用于测试 AI 的框架,而不是核心 AI 模型发布。

在 TechCrunch AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. TechCrunch AI TIER_1 English(EN) · Ram Iyer ·

    New Microsoft tool lets devs spin up AI behavior tests using text descriptions

    Microsoft on Tuesday took the wraps off Adaptive Spec-driven Scoring for Evaluation and Regression Testing, an open-source framework for spinning up AI evaluations.