一位用户发现,当反复询问时,ChatGPT对同一张午餐照片给出了截然不同的碳水化合物估算。在500次查询中,AI的回答差异很大,表明在关键任务中缺乏一致的输出。这种不一致性引发了对AI在需要精确和稳定答案的应用(如饮食管理)中的可靠性的担忧。 AI
影响 凸显了大型语言模型在精确、重复性任务中潜在的不可靠性,影响用户对AI驱动建议的信任。
排序理由 用户报告在特定应用中AI输出不一致。
在 Mastodon — sigmoid.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →