PulseAugur
实时 22:54:18
English(EN) LLMs believe false statements even after explicit warnings that they're false

大型语言模型尽管收到明确警告,仍保留虚假训练数据

新研究表明,大型语言模型即使在被明确告知信息是虚假的情况下,也难以忽略虚假信息。在实验中,Qwen、Kimi 和 GPT-4.1 等模型在训练数据中收到警告的情况下,仍将虚假陈述整合到其知识库中。这种被称为“否定忽视”的倾向可能解释了为什么大型语言模型经常生成不准确的信息,并凸显了整理高质量训练数据集的挑战。 AI

影响 凸显了大型语言模型训练数据处理中的一个关键缺陷,可能影响其可靠性,并需要新的数据整理和事实核查方法。

排序理由 该集群报告了一篇研究论文的发现,该论文详细介绍了大型语言模型如何在训练数据中收到明确警告的情况下整合虚假信息。

在 Ars Technica — AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

大型语言模型尽管收到明确警告,仍保留虚假训练数据

报道来源 [2]

  1. Ars Technica — AI TIER_1 English(EN) · Kyle Orland ·

    LLMs believe false statements even after explicit warnings that they're false

    Fine-tuning tests show "bias ... toward confidently representing the claims as true."

  2. Mastodon — mastodon.social TIER_1 English(EN) · [email protected] ·

    LLMs believe false statements even after explicit warnings that they're false https://arstechnica.com/ai/2026/05/llms-believe-false-statements-even-after-explic

    LLMs believe false statements even after explicit warnings that they're false https://arstechnica.com/ai/2026/05/llms-believe-false-statements-even-after-explicit-warnings-that-theyre-false/ # AI # MachineLearning # Research