English(EN) Archon: A Unified Multimodal Model for Holistic Digital Human Generation

Archon模型统一七种模态用于数字人生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 17:53

研究人员开发了Archon，一个新颖的统一多模态模型，旨在生成逼真的数字人。该模型使用独特的自回归方法集成了包括文本、音频和视觉内容在内的七种不同模态。Archon通过采用一种内存高效的技术，在保持详细动态的同时减少了令牌使用，从而解决了高保真视频生成中的挑战。 AI

影响引入了一个跨多种模态生成数字人的统一框架，可能推动沉浸式交互技术的发展。

排序理由该集群描述了一篇详细介绍新型多模态模型的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-28 17:53

Archon：一个统一的多模态模型，用于整体数字人生成

Digital humans are fundamental to immersive interaction, yet creating a unified model for holistic modalities, including text, audio, motion, and visual content, remains an open challenge. In this paper, we present Archon, a fully pretrained, human-centric unified multimodal mode…