研究人员推出了LongShOTBench,一个旨在评估长视频全模态推理能力的新基准。该基准整合了视觉、语音和环境音频,并提供了详细的诊断评估细则。同时,他们开发了LongShOTAgent,一个无需训练的智能体,在新测试平台上表现出色,超越了当前的多模态大语言模型。 AI
排序理由 该集群描述了一个用于评估AI在长视频理解能力方面的新学术基准和相关智能体的发布。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →