PulseAugur
实时 16:31:32
实体 AA-Briefcase

AA-Briefcase

PulseAugur coverage of AA-Briefcase — every cluster mentioning AA-Briefcase across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
时间线
  1. 2026-06-19 research_milestone SiliconFlow released the AA-Briefcase benchmark to evaluate LLM performance on long-horizon agentic knowledge work. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_100580 ·

    SiliconFlow 发布 AA-Briefcase 大型语言模型基准测试,用于代理知识工作

    SiliconFlow 推出了 AA-Briefcase 基准测试,旨在评估大型语言模型(LLM)在长周期代理知识工作中的表现。该新基准测试已包含 GPT-5.5 和最近发布的 GLM 5.2 的得分,为比较代理任务性能提供了一个有用的工具。