PulseAugur
实时 19:06:28
实体 Agent-EvalKit

Agent-EvalKit

PulseAugur coverage of Agent-EvalKit — every cluster mentioning Agent-EvalKit across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_85853 ·

    发布新工具包用于系统化评估 AI 代理

    一个名为 Agent-EvalKit 的新开源工具包已发布,用于系统化地评估 AI 代理。该工具包集成了多种 AI 编码助手,包括 Claude Code、Kiro CLI 和 Kilo Code。Agent-EvalKit 在 Apache 2.0 许可下可用,为评估 AI 代理性能提供了一个框架。