研究人员探讨了变分自编码器(VAE)的设计如何影响基于扩散模型的手语生成中的潜在姿态表示。他们发现,VAE中的架构和训练目标选择显著影响潜在空间的结构。这种影响反过来会影响下游文本到手语生成模型的性能,有时比单独的传统VAE重建精度更重要,这在Phoenix14T数据集上得到了证明。 AI
影响 研究了VAE设计选择如何影响潜在空间结构,进而影响文本到手语生成性能。
排序理由 该集群包含一篇详细介绍模型架构和数据集研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →