English(EN) MPerS: Dynamic MLLM MixExperts Perception-Guided Remote Sensing Scene Segmentation

新的MPerS方法使用多模态大语言模型进行遥感场景分割

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-11 16:00

研究人员开发了MPerS，一种利用多模态大语言模型（MLLMs）进行遥感场景分割的新方法。该方法使用多个MLLMs为遥感图像生成高质量的字幕，从而实现从不同专家视角的感知。该系统将这些文本语义与DINOv3提取的视觉特征自适应地集成，指导分割过程，以提高在公共数据集上的准确性。 AI

影响通过整合多模态大语言模型和专家引导的字幕生成，提出了一种改进遥感场景分割的新方法。

排序理由该集群包含一篇详细介绍使用多模态大语言模型进行场景分割的新颖方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Man On Pun · 2026-05-11 16:00

MPerS：动态多模态大模型混合专家感知引导的遥感场景分割

The multimodal fusion of images and scene captions has been extensively explored and applied in various fields. However, when dealing with complex remote sensing (RS) scenes, existing studies have predominantly concentrated on architectural optimizations for integrating textual s…