虎牙发布了VAM 1.0,一个实时多模态数字人模型,仅需一张照片输入即可进行对话、唱歌、跳舞和玩游戏。该模型基于DiT架构构建,可连续运行超过24小时,输出分辨率为480x832,帧率为28fps。与以往感觉像预录视频的AI数字人不同,VAM 1.0提供了真正的实时互动,包括处理打断、适应用户称呼偏好以及保持对话流畅性。该技术解决了时间稳定性、交互能力和计算效率等关键行业挑战,旨在增强直播、电商和新闻播报等应用。 AI
影响 为实时互动AI数字人树立了新标杆,可能加速其在直播和虚拟内容创作领域的应用。
排序理由 重要AI实验室(虎牙)发布新产品(VAM 1.0)。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →