研究人员开发了一种名为 MixTGFormer 的新方法用于三维人体姿态估计,旨在改进现有的基于 Transformer 的方法。这种新颖的网络将图卷积网络 (GCN) 集成到其 Transformer 架构中,以更好地捕捉局部骨骼关系和全局时空动态。在 Human3.6M 和 MPI-INF-3DHP 基准数据集上的实验表明,MixTGFormer 取得了最先进的成果,优于其他方法。 AI
排序理由 这是一篇研究论文,详细介绍了一种用于特定计算机视觉任务的新模型。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →