Character.ai 与 DigitalOcean 和 AMD 合作,在其 AI 娱乐平台上实现了生产推理性能的两倍提升。通过对 AMD Instinct MI300X 和 MI325X GPU 平台进行深度技术优化,利用专家混合模型并行化和高效 FP8 执行等先进技术,实现了这一显著改进。此次合作促成了与 DigitalOcean 为期多年、年达八位数的 GPU 基础设施协议,使 Character.ai 能够以可预测且具成本效益的方式扩展推理能力。 AI
影响 加速 AI 推理性能并降低成本,从而能够更有效地扩展大型语言模型。
排序理由 这是一个重要的行业事件,因为它详细介绍了领先的 AI 平台、云服务提供商和硬件制造商之间重大的性能优化和基础设施交易。[lever_c_demoted from significant: ic=1 ai=0.7]
- AMD
- AMD Instinct MI300X
- AMD Instinct MI325X
- Character.ai
- DigitalOcean
- DigitalOcean Kubernetes
- Qwen
- Qwen3-235B Instruct FP8
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →