English(EN) How to train your own Large Multimodal Model — with Hugo Laurençon & Leo Tronchon of HuggingFace M4

HuggingFace 发布 IDEFICS，一个开放访问的多模态模型，复制 Flamingo

作者 PulseAugur 编辑部 · [1 个来源] · 2024-01-19 17:09

HuggingFace 发布了 IDEFICS，这是一个开放访问的视觉语言模型，提供 9B 和 80B 参数版本。该模型旨在复制 DeepMind 的 Flamingo 的能力，处理交错的图像和文本，用于图像描述和创意生成等任务。IDEFICS 在一个名为 OBELICS 的新数据集上进行了训练，该数据集包含经过过滤的网络规模数据，其中包含文本和图像，并使用 Llama v1 模型进行语言处理，使用 CLIP 模型进行视觉处理。 AI

排序理由发布了一个开放访问的多模态模型和数据集的研究实验室。

在 Latent Space Podcast 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

HuggingFace 发布 IDEFICS，一个开放访问的多模态模型，复制 Flamingo

报道来源 [1]

Latent Space Podcast TIER_1 English(EN) · Latent.Space · 2024-01-19 17:09

How to train your own Large Multimodal Model — with Hugo Laurençon & Leo Tronchon of HuggingFace M4

Latent Space is heating up! Our <a href="https://lu.ma/llm-paper-club" target="_blank">paper club</a> ran into >99 person Discord limits, oops. We are also introducing 2 new online meetups: <a href="…

报道来源 [1]

How to train your own Large Multimodal Model — with Hugo Laurençon & Leo Tronchon of HuggingFace M4

相关话题