OneCanvas simplifies 3D scene understanding for VLMs with panoramic reprojection

By PulseAugur Editorial · [2 sources] · 2026-06-17 16:29

Researchers have developed OneCanvas, a novel approach to 3D scene understanding for vision-language models (VLMs). Instead of complex geometry encoders or extensive training, OneCanvas projects patch features onto a single panoramic canvas, preserving depth information with 3D position embeddings. This method allows pretrained VLMs to process the panoramic representation as a standard image, enabling situated reasoning from any viewpoint and supporting a spatial pretraining curriculum. OneCanvas achieves state-of-the-art results on benchmarks like SQA3D and VSI-Bench while requiring significantly less training compute. AI

IMPACT Simplifies 3D scene understanding for VLMs, potentially reducing training costs and enabling new applications in robotics and embodied AI.

RANK_REASON The cluster contains a research paper detailing a new method for 3D scene understanding in VLMs.

Read on arXiv cs.AI →

AI-generated summary · Google Gemini · from 2 sources. How we write summaries →

COVERAGE [2]

arXiv cs.AI TIER_1 English(EN) · Bart{\l}omiej Baranowski, Dave Zhenyu Chen, Matthias Nie{\ss}ner · 2026-06-18 04:00

OneCanvas: 3D Scene Understanding via Panoramic Reprojection

arXiv:2606.19253v1 Announce Type: cross Abstract: Existing approaches to 3D scene understanding in Vision-Language Models (VLMs) either rely on complex, model-specific geometry encoders or large training budgets in pursuit of spatial reasoning. Instead, OneCanvas aggregates patch…
arXiv cs.AI TIER_1 English(EN) · Matthias Nießner · 2026-06-17 16:29

OneCanvas: 3D Scene Understanding via Panoramic Reprojection

Existing approaches to 3D scene understanding in Vision-Language Models (VLMs) either rely on complex, model-specific geometry encoders or large training budgets in pursuit of spatial reasoning. Instead, OneCanvas aggregates patch features from all views onto a single equirectang…

COVERAGE [2]

OneCanvas: 3D Scene Understanding via Panoramic Reprojection

OneCanvas: 3D Scene Understanding via Panoramic Reprojection

RELATED ENTITIES

RELATED TOPICS