研究人员为CVPR 2026 VidLLMs挑战开发了一个名为“基于边距触发的问题重仲裁的答案自洽性”(ASC-MQRA)的新型框架。该框架旨在通过执行多次随机问答运行并聚合结果以实现自洽性,来改进视频中的视觉关系推理。还探索了一个额外的模块MQRA,通过重新评估不确定的示例来优化低边距预测,尽管它最终在测试集上显示出轻微的性能下降。 AI
影响 引入了一种改进视频视觉关系推理的新方法,可能推动多模态AI能力的发展。
排序理由 这是一篇详细介绍特定挑战新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →