PulseAugur
实时 08:35:24
English(EN) MSUE: Multi-Modal Soccer Understanding Expert

多专家AI系统在足球VQA挑战赛中达到0.95准确率

研究人员开发了MSUE,一个专为理解足球相关问题而设计的、利用多模态数据的多专家系统。该系统利用视觉语言模型进行数据合成,并利用大型语言模型将查询路由到专门的文本、图像和视频专家。通过集成Gemini3-Flash、经过微调的Qwen3-VL以及外部知识库,MSUE在2026 SoccerNet VQA挑战赛中取得了0.95的准确率,获得第三名。 AI

影响 展示了用于体育分析的高级多模态推理能力,有望改进自动化解说和粉丝互动工具。

排序理由 该集群包含一篇详细介绍新模型架构和基准性能的研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Litao Li, Yibo Yu, Yufeng Hu, Zhuo Yang, Jiali Wen, Yixin Chen, Yixi Zhou ·

    MSUE: Multi-Modal Soccer Understanding Expert

    arXiv:2606.12106v1 Announce Type: cross Abstract: This paper presents our solution to the 2026 SoccerNet VQA Challenge. We first develop a cost-effective data synthesis pipeline driven by a Vision-Language Model (VLM), which systematically restructures raw domain data into divers…

  2. arXiv cs.AI TIER_1 English(EN) · Yixi Zhou ·

    MSUE:多模态足球理解专家

    This paper presents our solution to the 2026 SoccerNet VQA Challenge. We first develop a cost-effective data synthesis pipeline driven by a Vision-Language Model (VLM), which systematically restructures raw domain data into diverse VQA samples, including concise answers and long-…