PulseAugur
实时 04:46:52
English(EN) When the Database Fails: Prompting LLM Dialogue Agents for Safe Recovery in Task-Oriented Dialogue

LLM 对话代理通过新的提示策略提高安全性 · 已追踪 2 个来源

一篇新的研究论文探讨了一种轻量级提示策略,以提高大型语言模型在面向任务的对话中数据库交互失败时的安全性。提出的“引导重试”(Guided-Retry)方法旨在减少幻觉,例如捏造预订详情或确认信息,而无需重新训练模型。该策略在包括 Llama 3Qwen 2.5 在内的六个开放权重模型家族上,在 MultiWOZ 2.2SGD 等基准测试中进行了测试,幻觉率显著降低了高达 50%。然而,残余幻觉仍然存在,尤其是在错误领域检索的情况下。 AI

影响 通过减少数据库故障期间的幻觉,增强了 LLM 在面向任务的对话中的可靠性。

排序理由 详细介绍 LLM 新提示策略的研究论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

LLM 对话代理通过新的提示策略提高安全性 · 已追踪 2 个来源

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Mohammad Alijanpour Shalmani, Alale Rezvani Boroujeni, Jiann Shiun Yuan ·

    当数据库失败时:提示LLM对话代理以安全地恢复面向任务的对话

    arXiv:2606.31307v1 Announce Type: new Abstract: Large language models used in task-oriented dialogue often produce fluent but unsafe responses when backend database calls fail, return empty results, or surface mismatched information, inventing venues, confirmations, or booking de…

  2. arXiv cs.CL TIER_1 English(EN) · Jiann Shiun Yuan ·

    当数据库失败时:提示大型语言模型对话代理以安全地恢复面向任务的对话

    Large language models used in task-oriented dialogue often produce fluent but unsafe responses when backend database calls fail, return empty results, or surface mismatched information, inventing venues, confirmations, or booking details not grounded in the database. We study a l…