PulseAugur
实时 18:06:20
实体 QA-Bench v0

QA-Bench v0

PulseAugur coverage of QA-Bench v0 — every cluster mentioning QA-Bench v0 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_19489 ·

    Canary 发布 AI QA 工具,在代码验证方面优于 GPT-5.4 和 Claude Code

    Canary 是一款新推出的、由 AI 驱动的 QA 工具,通过理解代码库并为用户工作流生成端到端测试,来自动化拉取请求的测试。该工具旨在在代码合并前捕获回归问题,填补了当前 AI 编码助手存在的空白。Canary 还推出了 QA-Bench v0,一个用于代码验证的基准测试,其专用 QA 代理在该测试中表现优于 GPT 5.4 和 Claude Code 等模型。