研究人员推出了CoMET-Bench,这是一个专为长视频中的条件化多事件时序定位(Conditional Multi-Event Temporal Grounding)设计的新基准。现有的基准不足,因为它们通常只定位单个事件或将定位和计数视为独立任务。CoMET-Bench包含一个具有复杂查询的大型数据集,并提出了一个统一的评估协议,以及一个新的Rejection-F1指标,以解决当前方法的局限性。提出的代理框架CoMET-Agent通过将任务重新构建为结构化搜索和聚合,展示了优于GPT-5的性能。 AI
排序理由 该集群包含一篇研究论文,介绍了视频时序定位的新基准和方法。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- CoMET-Agent
- CoMET-Bench
- Connected Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- GPT-5
- Hugging Face
- Litmaps
- ScienceCast
- scite Smart Citations
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →