Amazon SageMaker 推出了一项名为容量感知实例池的新功能,用于 AI 推理端点。此增强功能允许用户定义实例类型的优先级列表,从而使 SageMaker 在首选类型受限时能够自动选择可用基础设施。此功能旨在通过减少手动干预和提高可靠性来简化生成式 AI 工作负载的部署和扩展,特别是对于需要特定硬件的 LLM 和多模态模型。 AI
影响 提高了 AWS 上 AI 推理工作负载的可靠性并简化了扩展。
排序理由 现有云服务的更新。
在 AWS Machine Learning Blog 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →