研究人员推出了 FineVision,这是一个包含 2400 万个样本的新数据集,旨在推进视觉-语言模型(VLM)。该语料库通过一个半自动、人工参与的流程,整合了 200 多个来源,确保了数据的卫生、去重和安全性。与在现有开放数据集上训练的模型相比,在 FineVision 上训练的模型表现出更优越的性能,凸显了规模和细致的数据整理对 VLM 开发的重要性。该数据集及其整理工具的发布旨在促进以数据为中心的 VLM 方法的进一步研究。 AI
影响 提供了一个大型、干净的数据集,以加速视觉-语言模型的研究和开发。
排序理由 该集群描述了一篇介绍用于人工智能研究的大型数据集的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →