PulseAugur
实时 11:39:56
English(EN) Thinking with Geometry: Active Geometry Integration for Spatial Reasoning

GeoThinker框架主动集成几何以实现高级空间推理

研究人员开发了GeoThinker,一个新颖的框架,通过主动集成几何信息来增强多模态大语言模型(MLLMs)的空间推理能力。与以往的被动融合方法不同,GeoThinker允许模型根据其内部推理需求选择性地检索和整合相关的几何数据。这种通过空间基础融合(Spatial-Grounded Fusion)和重要性门控(Importance Gating)实现的主动集成,在空间智能基准测试中取得了最先进的性能,包括在VSI-Bench上达到了72.6的峰值分数。 AI

影响 引入了一种在MLLMs中进行主动几何集成的新方法,有望提高复杂空间任务的性能。

排序理由 介绍MLLMs空间推理新框架的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

GeoThinker框架主动集成几何以实现高级空间推理

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Haoyuan Li, Qihang Cao, Tao Tang, Kun Xiang, Zihan Guo, Jianhua Han, Hang Xu, JiaWang Bian, Xiaodan Liang ·

    几何思维:用于空间推理的主动几何集成

    arXiv:2602.06037v4 Announce Type: replace Abstract: Recent progress in spatial reasoning with Multimodal Large Language Models (MLLMs) increasingly leverages geometric priors from 3D encoders. However, most existing integration strategies remain passive: geometry is exposed as a …