PulseAugur
实时 14:59:49
English(EN) Which Models Perform Better in Inheritance Reasoning?

商业LLM在伊斯兰继承推理方面优于开源模型

一篇新论文评估了商业和开源大型语言模型在阿拉伯语伊斯兰继承推理任务上的表现。研究发现,商业模型普遍优于开源模型,在识别继承人、应用排除规则和保持一致性方面表现出更高的可靠性。Gemini 2.5 Flash 在评估的模型中表现最佳,平均倒数误差(MRE)为 0.989。 AI

影响 凸显了开源模型在复杂法律和数值推理方面的现有局限性,并指出了未来发展的方向。

排序理由 这是一篇评估LLM在特定推理任务上表现的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Mohammed Amine Mouhoub, Chahinez Bouchekif ·

    Which Models Perform Better in Inheritance Reasoning?

    arXiv:2606.13751v1 Announce Type: new Abstract: This paper presents the participation of team PSL in the QIAS 2026 Shared Task on Arabic Islamic inheritance reasoning. The task evaluates the ability of large language models to solve inheritance cases that require legal interpreta…