Amazon Bedrock AgentCore 现在支持自定义代码评估器,允许开发人员集成 AWS Lambda 函数以进行确定性的质量检查。此功能能够精确验证代理的输出,例如数值准确性、遵守特定工作流程以及隐藏个人身份信息 (PII),这在金融服务等领域至关重要。这些自定义评估器可用于开发管道和对实时生产流量进行评分,为特定验证任务提供了 LLM-as-a-Judge 的经济高效且可控的替代方案。 AI
影响 通过实现超越 LLM-as-a-Judge 的确定性、特定领域验证,增强了 AI 代理的可靠性和控制力。
排序理由 这是对现有产品的特性更新,并非新模型发布或重大的行业转变。
在 AWS Machine Learning Blog 阅读 →
- Amazon
- Amazon Bedrock AgentCore
- AWS Lambda
- Carter Williams
- Gitika Jha
- Irene Wang
- Lefan Zhang
- Ritvika Pillai
- Shoaib Javed
- Stephanie Yuan
- T.J Ariyawansa
- Vivek Singh
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →