English(EN) StepGap: A Hybrid NLI-LLM Checker for Step-Level Evidence-Gap Detectionin Multi-Hop Question Answering

新的混合NLI-LLM系统检测多跳问答中的证据差距

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 04:00

研究人员开发了StepGap，一个结合了自然语言推理（NLI）模型和大型语言模型（LLM）的新型混合系统，用于识别多跳问答中的证据差距。该系统将这些差距分为三种类型：矛盾声明、不相关证据和缺失桥梁，每种类型都建议了具体的修复操作。虽然StepGap的整体F1分数与仅LLM的基线相当，但其结构化方法提供了更好的可解释性，并避免了纯LLM方法中出现的错误抵消问题。当用于指导强化学习时，StepGap显著提高了Qwen2.5-7B-Instruct模型的精确匹配分数。 AI

影响这种混合方法为改进多跳问答系统提供了一种更具可解释性和鲁棒性的方法，有望带来更可靠的AI助手。

排序理由该集群包含一篇详细介绍问答新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Yuelyu Ji, Zhuochun Li, Hui Ji, Daqing He · 2026-05-26 04:00

StepGap: A Hybrid NLI-LLM Checker for Step-Level Evidence-Gap Detectionin Multi-Hop Question Answering

arXiv:2605.24733v1 Announce Type: new Abstract: We present \textbf{StepGap}, a hybrid NLI-LLM decision tree that detects step-level evidence gaps in multi-hop QA and emits one of three typed labels: \textsc{Contradicted Claim} (CC), \textsc{Irrelevant Evidence} (IE), or \textsc{M…

报道来源 [1]

StepGap: A Hybrid NLI-LLM Checker for Step-Level Evidence-Gap Detectionin Multi-Hop Question Answering

相关实体

相关话题