华为云发布了专为Agentic AI设计的全新基础设施,其“大模型工厂”能够实现10毫秒以内的Token生成。该系统整合了通用和智能计算资源,算力利用率提升超过30%,并为AI Agent提供百亿亿字节(Petabyte)级内存空间。该平台还包含ModelArts Next,一个全新的训练和推理平台,可自动将请求路由至15个以上SOTA模型中的最优解,平均成本降低20%。此举依托华为昇腾生态,表明国产算力在主流大模型上可实现媲美性能,例如DeepSeek模型在其硬件上部署的表现。 AI
影响 该基础设施旨在加速AI Agent的开发和部署,有望降低企业AI应用的成本并提高效率。
排序理由 主要科技公司发布新的AI基础设施平台。[lever_c_demoted from significant: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →