PulseAugur
实时 05:30:46
中文(ZH) 24小时直播,只靠一张照片?虎牙实时多模态数字人VAM 1.0率先突围行业三堵墙

虎牙发布VAM 1.0,首个24小时实时互动AI数字人

虎牙发布了VAM 1.0,一个实时多模态数字人模型,仅需一张照片输入即可进行对话、唱歌、跳舞和玩游戏。该模型基于DiT架构构建,可连续运行超过24小时,输出分辨率为480x832,帧率为28fps。与以往感觉像预录视频的AI数字人不同,VAM 1.0提供了真正的实时互动,包括处理打断、适应用户称呼偏好以及保持对话流畅性。该技术解决了时间稳定性、交互能力和计算效率等关键行业挑战,旨在增强直播、电商和新闻播报等应用。 AI

影响 为实时互动AI数字人树立了新标杆,可能加速其在直播和虚拟内容创作领域的应用。

排序理由 重要AI实验室(虎牙)发布新产品(VAM 1.0)。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

虎牙发布VAM 1.0,首个24小时实时互动AI数字人

报道来源 [1]

  1. 量子位 (QbitAI) TIER_1 中文(ZH) · 一水 ·

    24小时直播,仅凭一张照片?虎牙实时多模态数字人VAM 1.0率先打破三项行业壁垒

    能聊、能唱跳、能陪你玩游戏