Anthropic 的 Claude Sonnet 4.5 在引用索引方面遇到问题,导致其自我评估中的超链接不可靠。该模型的内部引用编号来自跨越整个对话的累积索引,而不是仅来自最近的搜索结果。虽然引用的事实内容仍然准确,但相关的链接可能指向不相关的来源,用户在寻求可验证信息时需要手动导航。 AI
影响 凸显了当前大型语言模型在引用准确性方面可能存在的问题,影响了它们在研究中的可靠性。
排序理由 用户生成的帖子,讨论了特定模型功能感知到的问题。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →