Infinity AI 推出了一个新的基础视频模型,能够生成逼真的会说话的 AI 角色。该模型使用由音频输入驱动的视频扩散 Transformer 进行训练。这种方法旨在克服现有工具的局限性,这些工具要么只能进行唇形同步,要么缺乏语音功能。该模型经过了大量的训练投入,可以驱动各种图像类型并处理唱歌,但它在处理动物、卡通方面存在困难,并且可能扭曲已知身份。 AI
影响 使创作者能够生成更逼真、更具表现力的、具有语音功能的 AI 驱动视频角色。
排序理由 这是初创公司的新产品发布,而不是大型 AI 实验室的前沿模型发布。
在 HN — machine learning stories 阅读 →
- Andrew
- Elon Musk
- Frank Sinatra
- HeyGen
- infinity
- Infinity AI
- Luma
- Mona Lisa
- Runway ML
- Sidney
- Synthesia
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →