English(EN) From Statute to Control Flow: Span-Grounded Deontic Trees for Defeasible Scope Parsing

AI模型难以处理法律例外，新基准揭示

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员推出了NormBench，这是一个旨在评估AI模型理解和解析法律及政策文件能力的新基准。该基准特别关注识别嵌套例外和反例外。基准使用基于跨度的义务树（SG-DT）来表示规则及其例外，从而实现更精确的范围解析。对当前大型语言模型的评估揭示了“递归衰减”和“可审计性陷阱”等问题，表明在处理复杂的规则结构和例外方面存在困难，尽管SG-DT在提高这些特定挑战上的表现方面显示出潜力。 AI

影响凸显了当前LLM在精确解读法律和政策方面的局限性，表明需要改进规则遵循代理的推理和可审计性。

排序理由该集群包含一篇研究论文，该论文引入了一个新的基准和方法论，用于评估AI在特定领域的 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Jian Chen, Siyuan Li, Chucheng Wan, Zixuan Yuan · 2026-06-09 04:00

从法规到控制流：基于跨度约束的非单方面推理树用于可撤销范围解析

arXiv:2606.08932v1 Announce Type: cross Abstract: Rule-following agents tasked with executing policies and regulations often fail via Silent Scope Omission (SSO): a model applies a general rule but silently drops nested exceptions or counter-exceptions, producing outputs that app…

报道来源 [1]

从法规到控制流：基于跨度约束的非单方面推理树用于可撤销范围解析

相关实体

相关话题