PulseAugur
实时 12:14:15
实体 Berkeley RDI

Berkeley RDI

PulseAugur coverage of Berkeley RDI — every cluster mentioning Berkeley RDI across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. SIGNIFICANT · CL_85182 ·

    GPT-5.5 在新的 AI Agent 基准测试中超越 Claude Fable 5

    OpenAI 的 GPT-5.5 在一个名为 Agents Last Exam (ALE) 的新 AI 基准测试中,性能优于 Anthropic 的 Claude Fable 5。该基准测试由伯克利 RDI 联合 300 多名专家开发,用于测试自主 AI Agent。这一结果令人惊讶,因为 Claude Fable 5 此前被认为是此类任务的领先模型。