阿里巴巴的 Wan 团队发布了 Wan 2.1,这是一个开源视频生成模型套件,旨在让高质量视频生成更加易于获取。该套件包括文本到视频、图像到视频和视频编辑功能,其参数大小针对高端和消费级 GPU 进行了优化。Wan 2.1 采用了一种 Diffusion Transformer 架构,并配备了一种新颖的视频变分自编码器,该编码器可保持时间因果关系以减少闪烁伪影,并支持中文和英文文本提示。 AI
影响 提高了高质量视频生成的可及性,可能促进多媒体创作的更广泛采用和创新。
排序理由 一家主要科技公司发布新的开源视频生成模型套件。 [lever_c_demoted from frontier_release: ic=1 ai=1.0]
在 dev.to — Claude Code tag 阅读 →
- Alibaba Group
- CogVideo
- Diffusion Transformer
- HunyuanVideo
- Open Sora
- RTX 4090
- Stable Diffusion 3
- T5 Text Encoder
- UMT5-XXL
- Wan 2.1
- Wan team
- Wan-VAE
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →