对六个大型语言模型在将木螺丝拧入刨花板时推荐正确导孔尺寸的能力进行了测试。查询了 Gemini、ChatGPT、Claude、Meta AI、DeepSeek 和 Kimi,结果和推理各不相同。Gemini 建议 3/32 英寸,ChatGPT 推荐 1/8 英寸,而 Claude 和 Meta AI 都建议以 7/64 英寸作为起点。DeepSeek 最初建议 1/8 英寸,但后来同意 7/64 英寸是可接受的。 AI
影响 说明了当前大型语言模型在实际、现实世界问题解决方面的能力和局限性。
排序理由 该集群讨论了多个大型语言模型在特定、非核心任务上的表现,并对其不同的回应和推理进行了评论。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →