中国AI公司MiniMax开发了ForgeTrain,一个完全由AI生成的全新预训练框架,并成功训练了一个名为MiniCPM5-1B的新型小型模型。该框架据称在训练速度上比NVIDIA的Megatron快10%,并提供了一种名为Forge Engineering的新软件范式,强调为特定模型和硬件定制代码生成。拥有10亿参数的MiniCPM5-1B模型,在其尺寸下展现出高智能密度,并专为边缘设备的有效部署而设计,展示了向更小、更强大AI模型发展的趋势。 AI
影响 通过自动化框架创建和实现更高效、更小的边缘部署模型,加速AI发展。
排序理由 AI生成的预训练框架及其训练的新模型,代表了一种新颖的AI开发方法。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →