研究人员开发了一种用于协调制度(HS)关税分类的确定性代理工作流,这是一项需要多维度规则推理的复杂任务。与自主规划代理不同,这种固定的控制流将语言模型调用限制在特定阶段,通过结构化输出和相关注释的逐字引用来确保可解释性。在HSCodeComp数据集上使用Qwen3.6-plus模型进行评估时,该工作流在四位和六位级别都取得了显著的准确性。一个开放权重Qwen3.6-27B-FP8骨干模型也表现出强劲的性能,并且一项人工审计表明现有地面真实标签可能存在差异。 AI
影响 为复杂的基于规则的AI任务引入了结构化方法,有可能提高专业领域的准确性和可解释性。
排序理由 学术论文,详细介绍了AI驱动分类的新方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →