PulseAugur
实时 04:21:42
实体 evalplus

evalplus

PulseAugur coverage of evalplus — every cluster mentioning evalplus across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_10517 ·

    IBM 新推出的 8B Granite 4.1 模型性能超越了旧款 32B MoE 版本

    IBM 发布了 Granite 4.1,这是一个专为企业设计的开源语言模型家族,包含三种尺寸(3B、8B 和 30B 参数)。值得注意的是,在 ArenaHard 和 GSM8K 等多项基准测试中,8B 密集模型表现出的性能与之前的 32B MoE 模型相当甚至更优。这一改进归功于 IBM 对数据质量的关注以及涉及 15 万亿 token 和迭代数据混合调整的复杂多阶段训练过程。