新的LLM对话框架将性能分解为“寻求者”和“持有者”角色

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-27 04:00

研究人员推出了一种新框架AIDG，该框架将多轮LLM对话正式分解为明确的“寻求者”（Seeker）和“持有者”（Holder）角色。该方法旨在超越单一的胜率指标，识别出特定的失败模式，例如合作优先泄露（cooperative-prior leakage）和约束推理干扰（constraint-reasoning interference）。对六个前沿LLM进行的实验表明，虽然防御能力存在聚集性，但进攻性能差异显著，其中框架策略（framing tactics）提高了信息提取的成功率，而违反约束是演绎失败的主要原因。 AI

影响为LLM对话能力提供了一个更精细化的评估框架，有助于更好地理解模型的优势和劣势。

排序理由学术论文，介绍了一种新的LLM框架和评估方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Adib Sakhawat, Fardeen Sadab, Rakin Shahriar · 2026-05-27 04:00

AIDG：多轮大语言模型对话中信息抽取与约束不对称性的形式化分解

arXiv:2602.17443v2 Announce Type: replace Abstract: Multi-turn LLM evaluation is typically reported as a single win-rate scalar, conflating distinct capabilities. We introduce AIDG (Adversarial Information Deduction Game), formalizing multi-turn adversarial dialogue as a two-play…

报道来源 [1]

AIDG：多轮大语言模型对话中信息抽取与约束不对称性的形式化分解

相关实体

相关话题