English(EN) Reported Confidence in LLMs Tracks Commitment More Than Correctness

研究发现：LLM置信度报告表明承诺而非正确性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

一项新的研究论文表明，大型语言模型（LLMs）报告的置信水平与其承诺给出答案的意愿相比，更能反映其真实正确性。该研究采用了一个两阶段的弃权范式，发现LLMs的口头置信度报告比它们预测答案是否正确，更能准确地预测它们是会给出答案还是弃权。这种分离现象在各种模型、提示框架和基准测试中都有观察到，表明口头置信度可能代表一种‘承诺就绪’状态，而不是可靠性的直接代理。 AI

影响挑战了将LLM口头置信度作为答案可靠性直接代理的普遍做法。

排序理由学术论文，详细介绍了LLM行为的新发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Dharshan Kumaran · 2026-06-30 04:00

报告称对大型语言模型的信心更多地反映了投入而非正确性

arXiv:2606.29490v1 Announce Type: cross Abstract: Confidence is an estimate of the probability that a chosen answer is correct. Verbal confidence reports are widely used as uncertainty measures in large language models, but whether they are best understood as estimates of correct…

报道来源 [1]

报告称对大型语言模型的信心更多地反映了投入而非正确性

相关实体

相关话题