English(EN) Granite 4.1 LLMs: How They’re Built

IBM 发布 Granite 4.1 LLMs，支持 512K 上下文并采用 Apache 2.0 许可

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-29 15:01

IBM 发布了 Granite 4.1 系列大型语言模型，包含 3B、8B 和 30B 参数版本。这些模型通过包含将上下文窗口扩展到 512K 标记的五阶段预训练过程，在约 15 万亿个标记上进行了训练。进一步的优化包括在精选数据上进行监督微调和强化学习。值得注意的是，8B 指令模型取得了与更大的 Granite 4.0 MoE 模型相当的性能，并且所有 Granite 4.1 模型均根据 Apache 2.0 许可提供。 AI

影响为研究人员和开发人员提供了具有扩展上下文能力的新型开源密集 LLM 选项。

排序理由发布了具有详细技术规格和训练方法的新系列 LLM。

在 Hugging Face Blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

IBM 发布 Granite 4.1 LLMs，支持 512K 上下文并采用 Apache 2.0 许可

报道来源 [1]

Hugging Face Blog TIER_1 English(EN) · 2026-04-29 15:01

Granite 4.1 LLMs：它们是如何构建的

报道来源 [1]

Granite 4.1 LLMs：它们是如何构建的

相关实体

相关话题