English(EN) Thinking with images

OpenAI 的新模型让 ChatGPT 能够用图像进行高级推理

作者 PulseAugur 编辑部 · [1 个来源] · 2025-04-16 10:00

OpenAI 推出了其最新的视觉推理模型 o3 和 o4-mini，这些模型允许 AI 在其内部推理过程中“用图像思考”。这些模型能够原生执行图像操作，如裁剪和缩放，从而增强 ChatGPT 分析复杂视觉数据的能力。这一进展在多模态基准测试中取得了最先进的性能，尤其是在 STEM 问答和视觉搜索方面，标志着向更强大的多模态 AI 代理迈出了重要一步。 AI

排序理由发布了具有系统卡的 Frontier-lab 模型。

在 OpenAI News 阅读 →

CharXiv
ChatGPT
MathVista
o3
OpenAI
VLMs are Blind
o4-mini

模型发布
论文

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

OpenAI News TIER_1 English(EN) · 2025-04-16 10:00

Thinking with images

报道来源 [1]

Thinking with images

相关实体

相关话题