新浪微博发布了VibeThinker-3B,一个只有30亿参数的开源模型。尽管体量小,它在数学和编码任务上的表现却能与DeepSeek V3.2和Kimi K2.5等更大模型相媲美。研究人员将这种效率归因于多阶段的后训练过程,从而提出了一个假设:逻辑推理可以有效地压缩到更小的模型中,而广泛的事实知识则不能。 AI
影响 证明了逻辑推理可以有效地压缩到更小的模型中,可能影响未来的模型开发策略。
排序理由 前沿实验室模型发布,附带系统卡 [lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →