对五个领先的AI系统——GPT-4、Claude 3 Opus、Claude 3 Sonnet、Gemini 1.5 Pro和Llama 3——的最新分析显示,它们对相同提示的回应存在显著的不一致性。当两次被问及相同的伦理和安全问题时,这些系统在自身和彼此之间频繁出现分歧,分歧率从34%到66%不等。这种变异性甚至发生在公认的伦理原则上,表明当前AI模型缺乏稳定的推理能力或存在根本性的架构问题。 AI
影响 凸显了AI推理中潜在的不可靠性,影响了在关键应用中的信任和部署。
排序理由 对AI模型行为的分析,而非直接发布或产品公告。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →