PulseAugur
实时 11:19:35
English(EN) A Camera-Native Talking-Head Video Dataset for Various Computer Vision Tasks

发布新的网络摄像头说话人脸视频数据集,用于计算机视觉研究

研究人员发布了一个新的说话人脸视频数据集,该数据集由消费级网络摄像头原生拍摄,旨在改进计算机视觉研究。该数据集包含 847 个录制片段,每个片段长 15 秒,来自 800 多名参与者,他们在自然环境下使用各种网络摄像头设备进行录制。这些录制片段以无损压缩方式保存,并附有质量评分注释,为视频压缩、超分辨率和质量评估模型的基准测试提供了宝贵的资源。 AI

影响 提供了一个大规模、高保真的数据集,以推进实时通信视频压缩、超分辨率和质量评估方面的研究。

排序理由 该集群包含一篇详细介绍用于计算机视觉任务的新数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Babak Naderi, Ross Cutler, Nabakumar Singh Khongbantabam ·

    面向各种计算机视觉任务的原生摄像机说话头视频数据集

    arXiv:2603.26763v2 Announce Type: replace Abstract: Talking-head videos constitute a predominant content type in real-time communication, yet publicly available datasets for video processing research in this domain remain scarce and limited in signal fidelity. In this paper, we o…