名为 Cosmos 的全模态模型新家族已发布,包含三个变体:Edge (4B)、Nano (16B) 和 Super (64B)。这些模型旨在统一的 Transformer 混合架构内处理和生成包括文本、图像、视频、音频和动作序列在内的各种模态。Super 变体包含针对文本到图像和图像到视频任务的专门微调。 AI
影响 引入了统一的多模态人工智能架构,可能简化跨各种生成任务的开发。
排序理由 发布了一个包含多个变体的新开源模型家族。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →