PulseAugur
实时 13:12:25
English(EN) Granite 4.1: IBM's 8B Model Matching 32B MoE https:// firethering.com/granite-4-1-ib m-open-source-model-family/ # HackerNews # Granite # IBM # Model # MoE # AI

IBM 新推出的 8B Granite 4.1 模型性能超越了旧款 32B MoE 版本

IBM 发布了 Granite 4.1,这是一个专为企业设计的开源语言模型家族,包含三种尺寸(3B、8B 和 30B 参数)。值得注意的是,在 ArenaHardGSM8K 等多项基准测试中,8B 密集模型表现出的性能与之前的 32B MoE 模型相当甚至更优。这一改进归功于 IBM 对数据质量的关注以及涉及 15 万亿 token 和迭代数据混合调整的复杂多阶段训练过程。 AI

影响 IBM 新推出的 Granite 4.1 模型,特别是高效的 8B 版本,为优先考虑性能和成本可预测性的企业提供了一个引人注目的替代方案。

排序理由 发布了一个开源模型家族,并提供了详细的性能基准和训练方法。

在 Mastodon — fosstodon.org 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →

IBM 新推出的 8B Granite 4.1 模型性能超越了旧款 32B MoE 版本

报道来源 [3]

  1. Mastodon — fosstodon.org TIER_1 English(EN) · [email protected] ·

    Granite 4.1:IBM 的 8B 模型媲美 32B MoE

    Granite 4.1: IBM's 8B Model Matching 32B MoE https:// firethering.com/granite-4-1-ib m-open-source-model-family/ # HackerNews # Granite # IBM # Model # MoE # AI

  2. Mastodon — fosstodon.org TIER_1 English(EN) · [email protected] ·

    IBM 发布 Granite 4.1,一系列专为企业用途构建的开源语言模型。基准测试中有一项结果值得关注

    IBM just released Granite 4.1, a family of open source language models built specifically for enterprise use. There’s one result in the benchmark worth attention. The 8B model. Dense architecture, no MoE tricks, no extended reasoning chains. It matches or beats Granite 4.0-H-Smal…

  3. Mastodon — mastodon.social TIER_1 English(EN) · [email protected] ·

    Granite 4.1:IBM 的 8B 模型媲美 32B MoE

    Granite 4.1: IBM's 8B Model Matching 32B MoE https://firethering.com/granite-4-1-ibm-open-source-model-family/ # HackerNews # Tech # AI