一款名为“Synchrotron”的新型文本到视频模型已发布,能够生成音频响应式视觉内容。该模型结合了 Stable Audio 3 和 LTX 2.3,暗示了先进音频合成和视频生成能力的集成。其输出展示了将文本提示和伴随音频转化为动态视频内容的复杂能力。 AI
影响 展示了音频响应式文本到视频生成的新能力,可能对创意媒体制作产生影响。
排序理由 这是一个结合现有模型的新产品发布,而非前沿模型发布或重大行业事件。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →