English(EN) Reasoners or Translators? Contamination-aware Evaluation and Neuro-Symbolic Robustness in Tax Law

研究：神经符号AI在法律推理方面比LLM更鲁棒

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-15 15:20

一项发表在arXiv上的新研究调查了大型语言模型是否真正理解法律推理，或者其表现是否因数据污染而被夸大。研究人员开发了一种污染检测协议，并发现性能确实可以被人为提升。该研究提倡使用神经符号框架，该框架将LLM与形式化表示和符号求解器相结合，作为更可靠、更鲁棒的法律AI方法，展示了更好的泛化能力。 AI

影响强调了当前LLM在复杂推理任务中的局限性，并提出了神经符号方法以实现更可靠的法律AI应用。

排序理由该集群包含一篇学术论文，详细介绍了一种新的评估方法，并提出了一种替代的AI方法用于法律推理。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Enrico Santus · 2026-05-15 15:20

Reasoners or Translators? Contamination-aware Evaluation and Neuro-Symbolic Robustness in Tax Law

Recent advances in large language models (LLMs) have significantly enhanced automated legal reasoning. Yet, it remains unclear whether their performance reflects genuine legal reasoning ability or artifacts of data contamination. We present a comprehensive empirical study of tax …

报道来源 [1]

Reasoners or Translators? Contamination-aware Evaluation and Neuro-Symbolic Robustness in Tax Law

相关实体

相关话题