Anthropic 的 Claude Fable 模型在 ZeroBench 基准测试上已达到与 GPT 相当的水平,该基准测试是对视觉能力的一项严峻考验。这一进展表明多模态人工智能取得了重大进展,使 Claude Fable 在复杂视觉推理任务上的表现与领先模型相媲美。 AI
影响 展示了多模态人工智能能力的竞争性进展,可能影响未来的模型开发和评估。
排序理由 该集群报告了一个模型达到了基准分数,这是一个研究里程碑。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →