English(EN) Hybrid Autoregressive-Diffusion Model for Real-Time Sign Language Production

新型混合模型提升实时手语生成能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

研究人员开发了HybridSign，一种融合了自回归和扩散技术的新型模型，可实现更高效、实时的手语生成。该方法旨在克服扩散模型的延迟问题和自回归模型的错误累积问题。HybridSign采用多尺度姿态表示和置信度感知因果注意力机制，以增强鲁棒性并捕捉详细的发音器官特征。在基准数据集上的实验表明，HybridSign在生成质量和速度之间取得了卓越的平衡，显著降低了延迟并提高了吞吐量。 AI

影响这项研究可能带来更具响应性和准确性的AI驱动的手语翻译工具，从而提高可访问性。

排序理由这是一篇详细介绍新型模型架构及其在基准数据集上实验结果的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Maoxiao Ye, Xinfeng Ye, Mano Manoharan · 2026-06-03 04:00

用于实时手语生成的混合自回归-扩散模型

arXiv:2507.09105v4 Announce Type: replace Abstract: Earlier Sign Language Production (SLP) models typically relied on autoregressive decoding, which naturally preserves temporal causality but suffers from error accumulation at inference time. More recent diffusion-based approache…

报道来源 [1]

用于实时手语生成的混合自回归-扩散模型

相关实体

相关话题