Stability AI 发布了其 Stable Audio 3 系列模型,包括小型和中型版本,旨在实现高效的可变长度音频生成和编辑。这些潜在扩散模型基于新颖的语义声学自动编码器运行,并利用对抗性后训练来提高速度和质量。这些模型在许可和知识共享数据上进行训练,可以在几秒钟内生成音乐和声音,小型和中型版本能够运行在消费级硬件上。 AI
影响 加速了消费者和专业人士的 AI 音频创作和编辑。
排序理由 来自前沿实验室 (Stability AI) 的模型发布,包含模型权重和推理管道。[lever_c_demoted from frontier_release: ic=2 ai=1.0]
在 Hugging Face Trending Models 阅读 →
- Gemma
- Stability AI
- Stable Audio 3 Medium
- T5Gemma
- stabilityai/stable-audio-3-medium
- stabilityai/stable-audio-3-small-music
- Stable Audio 3
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →