English(EN) Temporal Preservation over Processing: Diagnosing and Designing Spatiotemporal Single-Stage Video Detectors

新的诊断工具和YOLO-3D检测器评估视频分析中的时序推理

作者 PulseAugur 编辑部 · [1 个来源] · 2026-07-01 04:00

研究人员开发了一个名为TemporalLens的新诊断框架，用于评估单阶段视频对象检测器在多大程度上利用了时序上下文。该框架通过各种受控扰动来探测时序依赖性，揭示了标准指标可能会掩盖模型是真正进行时序推理还是仅仅依赖于单个信息帧。该研究还引入了YOLO-3D，一个基于YOLOv8构建的时空检测器，证明了在骨干网络中保留时序深度可以显著提高性能。 AI

影响通过提供衡量和改进时序推理能力的工具，增强了对视频分析模型的理解和开发。

排序理由学术论文，详细介绍了用于视频分析的新诊断框架和检测器架构。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Karam Tomotaki-Dawoud, Anna Hilsmann, Peter Eisert, Sebastian Bosse · 2026-07-01 04:00

Temporal Preservation over Processing: Diagnosing and Designing Spatiotemporal Single-Stage Video Detectors

arXiv:2606.31421v1 Announce Type: cross Abstract: Single-stage video object detectors are increasingly deployed in time-critical applications, yet it remains unclear whether these models genuinely reason over temporal context or merely exploit a single informative frame-a gap hid…

报道来源 [1]

Temporal Preservation over Processing: Diagnosing and Designing Spatiotemporal Single-Stage Video Detectors

相关实体

相关话题