HuggingFace 发布了 IDEFICS,这是一个开放访问的视觉语言模型,提供 9B 和 80B 参数版本。该模型旨在复制 DeepMind 的 Flamingo 的能力,处理交错的图像和文本,用于图像描述和创意生成等任务。IDEFICS 在一个名为 OBELICS 的新数据集上进行了训练,该数据集包含经过过滤的网络规模数据,其中包含文本和图像,并使用 Llama v1 模型进行语言处理,使用 CLIP 模型进行视觉处理。 AI
排序理由 发布了一个开放访问的多模态模型和数据集的研究实验室。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →