Amazon SageMaker AI 现在提供了一种提高 AI 代理工具调用准确性的方法。这是通过采用监督微调 (SFT) 和直接偏好优化 (DPO) 技术来实现的。该过程涉及使用精选数据集和人类反馈来训练小型语言模型 (SLM),以提高其为任务选择正确工具的能力。 AI
影响 增强了 AI 代理的可靠性和效率,有可能降低部署代理应用程序的企业的运营成本。
排序理由 文章描述了一种在现有平台上改进 AI 代理功能的新方法,而不是发布新模型。
在 AWS Machine Learning Blog 阅读 →
- AI agents
- Amazon SageMaker AI
- Direct Preference Optimization
- Qwen3 1.7B
- small language model
- Supervised Fine-Tuning
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →