English(EN) CaC: Advancing Video Reward Models via Hierarchical Spatiotemporal Concentrating

新型视频异常检测模型'CaC'提高检测精度

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-29 04:00

研究人员推出了一种新颖的视频异常检测模型Concentrate and Concentrate (CaC)，该模型利用了视觉-语言模型。CaC采用粗粒度到细粒度的方法，首先全局识别异常时间窗口，然后在这些窗口内执行详细的空间定位。该模型采用三阶段渐进式范式进行训练，结合了监督微调和具有自定义时空IoU奖励的强化学习。实验表明，CaC在细粒度异常基准测试中准确率提高了25.7%，并减少了生成视频中的异常11.7%。 AI

排序理由该集群包含一篇详细介绍新模型及其性能的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Jiyuan Wang, Huan Ouyang, Jiuzhou Lin, Chunyu Lin, Dewen Fan, Boheng Zhang, Haonan Fan, Fei Zuo, Jia Sun, Huaiqing Wang, Honglie Wang, Yiyang Fan, Zhenlong Yuan, Zijun Li, Yongrui Heng, Guosheng Lin, Fan Yang, Tingting Gao · 2026-05-29 04:00

CaC：通过分层时空聚焦推进视频奖励模型

arXiv:2605.11723v2 Announce Type: replace-cross Abstract: In this paper, we propose Concentrate and Concentrate (CaC), a coarse-to-fine anomaly reward model based on Vision-Language Models. During inference, it first conducts a global temporal scan to anchor anomalous time window…

报道来源 [1]

CaC：通过分层时空聚焦推进视频奖励模型

相关实体

相关话题