新的CapRiCorn-1K基准评估视频字幕一致性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-20 08:37

研究人员推出CapRiCorn-1K，一个旨在评估视频字幕模型的新基准。该基准特别评估了字幕在不同视频长度和领域内的准确性、全面性以及主体指代一致性。使用CapRiCorn-1K进行的实验表明，当前模型在这些方面存在困难，尤其随着视频时长的增加，字幕质量和一致性会下降。该基准的指标已证明与下游任务具有很强的相关性，验证了它们在评估字幕性能方面的有效性。 AI

影响该基准通过突出当前字幕准确性和一致性方面的局限性，有望推动视频理解模型的改进。

排序理由该集群描述了一个用于评估AI模型的新学术基准，发布在arXiv上。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Tieniu Tan · 2026-06-20 08:37

CapRiCorn-1K：一个用于视频字幕生成和跨时间尺度的主体指代一致性的综合基准

Accurate and comprehensive video captions with consistent subject references are critical for downstream understanding and generation tasks. However, few existing benchmarks can objectively and comprehensively evaluate these properties across diverse durations and scenarios, ther…

报道来源 [1]

CapRiCorn-1K：一个用于视频字幕生成和跨时间尺度的主体指代一致性的综合基准

相关实体

相关话题