Amazon SageMaker AI 推出了新功能,以简化生成式 AI 模型的部署。该平台现在提供优化的推理建议,利用 NVIDIA AIPerf 缩短了开发人员数周的手动基准测试过程。此外,AWS 推出了由 NVIDIA RTX PRO 6000 Blackwell Server Edition GPU 驱动的 G7e 实例,提供了更高的内存和网络吞吐量,从而实现更快、更具成本效益的大型语言模型推理。 AI
影响 通过自动化配置和提供增强的硬件,简化了生成式 AI 模型的部署,有可能缩短上市时间和降低基础设施成本。
排序理由 该集群描述了一个现有 AI 平台的新功能和硬件可用性,旨在改进用户的部署流程。
在 AWS Machine Learning Blog 阅读 →
- Amazon EC2
- Amazon SageMaker AI
- AWS
- EFA
- G7e instances
- GPT-OSS-120B
- Nemotron-3-Super-120B-A12B
- NVIDIA
- NVIDIA AIPerf
- NVIDIA Dynamo
- Qwen3.5-35B-A3B
- RTX PRO 6000 Blackwell Server Edition GPUs
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →