商汤科技发布了SenseNova U1,一个拥有80亿参数的开源模型,通过移除VAE组件重新定义了图像生成能力。这种名为NEO-unify的新架构实现了语言和视觉的端到端直接建模,在像素级别进行处理,消除了压缩带来的信息损失。该模型在各种基准测试中表现出最先进的性能,在同类模型中超越了一些闭源模型,并根据Apache 2.0许可协议可用于商业用途。 AI
影响 为开源图像生成树立了新的标杆,可能加速统一多模态架构的采用。
排序理由 重要AI实验室(商汤科技)发布的新模型,具有新颖的架构。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- Apache 2.0
- ComfyUI
- DALL-E 3
- FLUX
- GPT-4o
- LLaVA
- NEO-unify
- Qwen-VL
- SenseNova U1
- SenseTime
- Stable Diffusion
- VAE
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →