PulseAugur
实时 04:21:21
实体 Wonderbot

Wonderbot

PulseAugur coverage of Wonderbot — every cluster mentioning Wonderbot across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_69993 ·

    AI 智能体评估框架评估能力、效率和鲁棒性

    本文介绍了一个用于评估 AI 智能体的框架,解决了非确定性输出和多种故障模式的挑战。该框架从能力、效率和鲁棒性三个维度评估智能体。它使用一个带有天气、计算和产品信息模拟工具的 ReAct 智能体来演示评估过程。作者详细介绍了测试用例和结果的数据结构,包括工具准确性、输出正确性和延迟等指标。