Amazon SageMaker AI 异步推理已推出对内联请求负载的支持,允许用户直接在 InvokeEndpointAsync API 请求体中发送推理数据。此更新消除了之前将小负载上传到 Amazon S3 的要求,简化了客户端代码,并通过消除一次网络往返来降低延迟。此新功能特别有利于输入尺寸较小(最多 128,000 字节)但处理时间比实时推理更长的负载。 AI
影响 通过降低特定用例的延迟和运营开销,简化了机器学习推理工作流。
排序理由 这是现有云机器学习平台服务的更新功能,并非新模型发布或重大的行业转变。
在 Mastodon — fosstodon.org 阅读 →
- Amazon S3
- Amazon SageMaker
- Amazon Simple Notification Service
- Async Inference
- AWS Identity and Access Management
- InvokeEndpointAsync
- AWS
- InvokeEndpointAsync API
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →