IBM发布了Granite 4.0 3B Vision,这是一款专为企业文档设计的紧凑型多模态智能模型。NVIDIA推出了Nemotron 3 Nano Omni,这是一款适用于文档、语音和视频代理的长上下文多模态智能模型。此外,Hugging Face详细介绍了一种在hub buckets中传输一万亿参数的方法,重点关注TRL内的增量权重同步。 AI
影响 IBM和NVIDIA的新款多模态模型为企业应用提供了增强的功能,而Hugging Face的基础设施更新可能会提高大型模型训练的效率。
排序理由 多家科技巨头发布多项AI模型和基础设施公告。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →