English(EN) MapTab: Are MLLMs Ready for Multi-Criteria Route Planning in Heterogeneous Graphs?

新的MapTab基准测试多模态大语言模型处理复杂路线规划任务

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-22 04:00

研究人员推出了MapTab，这是一个旨在评估多模态大语言模型（MLLMs）多标准推理能力的新基准。该基准利用路线规划任务，将视觉地图数据与时间、价格等标准的结构化表格信息相结合。MapTab包含Metromap和Travelmap两个场景，拥有大量的地图、查询和问题数据集，以挑战MLLMs。初步评估表明，当前MLLMs在这些复杂的多模态推理任务上存在困难，有时在视觉感知受限时表现不如单模态方法。 AI

影响为多模态大语言模型建立了一个新的评估标准，推动其具备超越当前基准的更强大的推理能力。

排序理由该集群包含一篇介绍多模态大语言模型评估新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Ziqiao Shang, Lingyue Ge, Zi-Jian Cheng, Shi-Yu Tian, Zhenyu Huang, Wenbo Fu, Weiming Wu, Yang Chen, Xiangwen Zhang, Yulan Hu, Bin Liu, Yu-Feng Li, Lan-Zhe Guo · 2026-05-22 04:00

MapTab: Are MLLMs Ready for Multi-Criteria Route Planning in Heterogeneous Graphs?

arXiv:2602.18600v3 Announce Type: replace Abstract: Systematic evaluation of Multimodal Large Language Models (MLLMs) is crucial for advancing Artificial General Intelligence (AGI). However, existing benchmarks remain insufficient for rigorously assessing their reasoning capabili…

报道来源 [1]

MapTab: Are MLLMs Ready for Multi-Criteria Route Planning in Heterogeneous Graphs?

相关实体

相关话题