根据斯坦福大学的研究,本地大语言模型已显著改进,目前能准确处理 71.3% 的真实世界查询,远高于去年的 23.2%。这一进步以小米新推出的 MiMo-v2.5-Pro 模型为代表,该模型拥有万亿参数且开放权重,在编码基准测试中可媲美顶级闭源模型,并在普通硬件上实现每秒超过 1000 个 token 的处理速度。本地模型日益增长的能力和效率正开始挑战基于 API 的前沿模型在成本上的主导地位,尽管一些复杂任务仍需要更高级的解决方案。 AI
影响 本地模型正在迅速缩小与前沿 API 的能力差距,可能颠覆每月处理数百万 token 的成本计算。
排序理由 该集群报道了本地大模型能力的重大进展以及一款高性能开放权重模型的发布。[lever_c_demoted from significant: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →