研究人员发布了一个新的说话人脸视频数据集,该数据集由消费级网络摄像头原生拍摄,旨在改进计算机视觉研究。该数据集包含 847 个录制片段,每个片段长 15 秒,来自 800 多名参与者,他们在自然环境下使用各种网络摄像头设备进行录制。这些录制片段以无损压缩方式保存,并附有质量评分注释,为视频压缩、超分辨率和质量评估模型的基准测试提供了宝贵的资源。 AI
影响 提供了一个大规模、高保真的数据集,以推进实时通信视频压缩、超分辨率和质量评估方面的研究。
排序理由 该集群包含一篇详细介绍用于计算机视觉任务的新数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →