English(EN) Why language models hallucinate

OpenAI 研究语言模型产生幻觉的原因及其神经元解释方法

作者 PulseAugur 编辑部 · [2 个来源] · 2023-05-09 07:00

OpenAI 发布了解决大型语言模型两大挑战的研究：幻觉和可解释性。他们关于幻觉的论文认为，当前的评估方法会激励模型猜测而非承认不确定性，从而导致自信但错误的陈述。为解决此问题，他们建议对自信的错误给予比不确定性更重的惩罚。同时，OpenAI 开发了一种使用 GPT-4 自动生成和评分语言模型内单个神经元行为自然语言解释的方法，并发布了一个用于 GPT-2 的数据集以辅助可解释性研究。 AI

排序理由 OpenAI 发布了两篇研究论文，详细介绍了他们在模型幻觉和可解释性方面的发现，包括发布数据集和代码。

在 OpenAI News 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

OpenAI News TIER_1 English(EN) · 2025-09-05 10:00

语言模型为何会产生幻觉

OpenAI’s new research explains why language models hallucinate. The findings show how improved evaluations can enhance AI reliability, honesty, and safety.
OpenAI News TIER_1 (CA) · 2023-05-09 07:00

语言模型可以解释语言模型中的神经元

We use GPT-4 to automatically write explanations for the behavior of neurons in large language models and to score those explanations. We release a dataset of these (imperfect) explanations and scores for every neuron in GPT-2.

报道来源 [2]

语言模型为何会产生幻觉

语言模型可以解释语言模型中的神经元

相关话题