OpenAI 发布了解决大型语言模型两大挑战的研究:幻觉和可解释性。他们关于幻觉的论文认为,当前的评估方法会激励模型猜测而非承认不确定性,从而导致自信但错误的陈述。为解决此问题,他们建议对自信的错误给予比不确定性更重的惩罚。同时,OpenAI 开发了一种使用 GPT-4 自动生成和评分语言模型内单个神经元行为自然语言解释的方法,并发布了一个用于 GPT-2 的数据集以辅助可解释性研究。 AI
排序理由 OpenAI 发布了两篇研究论文,详细介绍了他们在模型幻觉和可解释性方面的发现,包括发布数据集和代码。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →