English(EN) NarrativeTrack: Evaluating Entity-Centric Reasoning for Narrative Understanding

新的NarrativeTrack基准测试MLLMs在视频中的以实体为中心的推理能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-07-03 04:00

研究人员推出了一款名为NarrativeTrack的新型基准测试，旨在评估多模态大语言模型（MLLMs）的叙事理解能力。该基准测试侧重于以实体为中心的推理，评估模型在时间展开的视频叙事中跟踪实体、实体变化以及歧义的能力。当前最先进的MLLMs在鲁棒的实体跟踪方面存在困难，表现出感知基础与时间连贯性之间的权衡，凸显了更好地整合这些能力的需求。 AI

影响该基准测试将帮助研究人员识别和改进MLLMs理解复杂视频叙事的能力，这对于需要时间感知和实体感知推理的应用至关重要。

排序理由该集群包含一篇介绍新AI模型评估基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

新的NarrativeTrack基准测试MLLMs在视频中的以实体为中心的推理能力

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Hyeonjeong Ha, Jinjin Ge, Bo Feng, Kaixin Ma, Gargi Chakraborty · 2026-07-03 04:00

NarrativeTrack: Evaluating Entity-Centric Reasoning for Narrative Understanding

arXiv:2601.01095v3 Announce Type: replace-cross Abstract: Multimodal large language models (MLLMs) have achieved impressive progress in vision-language reasoning, yet their ability to understand temporally unfolding narratives in videos remains underexplored. True narrative under…

报道来源 [1]

NarrativeTrack: Evaluating Entity-Centric Reasoning for Narrative Understanding

相关实体

相关话题