English(EN) When Should an AI Workflow Release? Always-Valid Inference for Black-Box Generate-Verify Systems

新的 AI 包装器指导迭代工作流的发布决策

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-13 03:30

研究人员开发了一种新的统计方法，用于确定 AI 工作流何时应发布其输出，特别是对于使用迭代生成-评估-修订循环的系统。这种“始终有效的发布包装器”解决了在无法使用传统校准模型的情况下，通过自适应生成的评估分数来做出发布决策的挑战。所提出的包装器创建了一个失败参考池来校准分数，并使用 e-process 来保证有效性，旨在控制在不可行任务上发布的概率，同时仍允许在可行任务上发布。 AI

影响提供了一个统计框架，通过优化发布决策来提高 AI 系统输出的可靠性。

排序理由该集群包含一篇详细介绍 AI 系统新统计方法的学术论文。

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv stat.ML TIER_1 English(EN) · Young Hyun Cho, Will Wei Sun · 2026-05-14 04:00

AI工作流何时发布？黑盒生成-验证系统的始终有效推理

arXiv:2605.12947v1 Announce Type: new Abstract: LLM-enabled AI workflows increasingly produce outputs through iterative generate-evaluate-revise loops. Each iteration can improve the candidate, but it also creates a release decision: when to stop and output the current result? Th…
arXiv stat.ML TIER_1 English(EN) · Will Wei Sun · 2026-05-13 03:30

何时应发布AI工作流？黑盒生成-验证系统的始终有效推理

LLM-enabled AI workflows increasingly produce outputs through iterative generate-evaluate-revise loops. Each iteration can improve the candidate, but it also creates a release decision: when to stop and output the current result? This raises a statistical challenge because deploy…

报道来源 [2]

AI工作流何时发布？黑盒生成-验证系统的始终有效推理

何时应发布AI工作流？黑盒生成-验证系统的始终有效推理

相关实体

相关话题