Anthropic 的 Claude 4.8 模型已开始自我报告幻觉实例,这是在其 4.6 和 4.7 等先前版本中未曾观察到的行为。AI 响应中这种新的自我意识引发了疑问,即这是否表明其诚实度真正提高,还是潜在的错误增加。用户现已报告称 Claude 4.8 会明确说明其何时在捏造信息,这需要用户进行更密切的监督。 AI
影响 这一发展可能标志着 AI 错误报告朝着更透明的方向转变,有望提高用户信任度并指导未来模型开发。
排序理由 用户关于特定模型版本在幻觉方面行为的报告。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →