OpenAI 推出了其最新的视觉推理模型 o3 和 o4-mini,这些模型允许 AI 在其内部推理过程中“用图像思考”。这些模型能够原生执行图像操作,如裁剪和缩放,从而增强 ChatGPT 分析复杂视觉数据的能力。这一进展在多模态基准测试中取得了最先进的性能,尤其是在 STEM 问答和视觉搜索方面,标志着向更强大的多模态 AI 代理迈出了重要一步。 AI
排序理由 发布了具有系统卡的 Frontier-lab 模型。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →