PulseAugur
实时 17:25:00
实体 SimpleBench

SimpleBench

PulseAugur coverage of SimpleBench — every cluster mentioning SimpleBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_83524 ·

    Anthropic 的 Claude Fable 5 以 81.9% 的分数在 Simplebench 上名列前茅

    Anthropic 的 Claude Fable 5 模型在 Simplebench 基准测试中取得了 81.9% 的分数。这一成绩使其在该评估的排行榜上名列前茅。这一成就凸显了大型语言模型能力的持续进步。

  2. TOOL · CL_83407 ·

    新AI模型在SimpleBench上登顶,接近人类表现

    一款新AI模型在SimpleBench基准测试中取得了最高分,险些达到人类基线水平。该模型的表现预示着AI能力取得了重大进展,尤其是在模仿人类推理和解决问题的任务上。