研究人员推出了一种名为“光学推理”的新方法,该方法利用图像作为AI推理的主要媒介,超越了传统的基于文本的方法。该技术包含两种变体:基于排版的光学推理,用于紧凑的推理渲染;以及基于图形的光学推理,用于结构化的视觉推理。实验表明,在各种基准测试中,光学推理可以媲美甚至超越基于文本的推理,显著减少推理token并提高token效率。 AI
影响 通过利用视觉数据来处理复杂的推理任务,这种方法有望带来更高效、更多功能的AI模型。
排序理由 该集群包含一篇详细介绍新研究概念和方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →