面向零样本骨骼动作识别的增强扩散模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:00

研究人员开发了一种名为“面向骨骼-文本匹配的频率感知扩散模型”（FDSM）的新方法，以改进零样本骨骼动作识别。该方法解决了扩散模型中可能导致运动动态过度平滑的光谱偏差问题。FDSM 结合了语义引导的光谱残差学习和时间步长自适应光谱损失模块，以及基于课程的语义抽象，以更好地捕捉细粒度的运动细节。该方法在多个基准数据集上取得了最先进的结果。 AI

影响通过解决扩散模型的局限性，引入了一种增强零样本动作识别的新技术，有望改善监控和人机交互等应用。

排序理由这是一篇详细介绍骨骼动作识别新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Yuxi Zhou, Zhengbo Zhang, Jingyu Pan, Zhiyu Lin, Zhigang Tu · 2026-05-08 04:00

Frequency-Enhanced Diffusion Models: Curriculum-Guided Semantic Alignment for Zero-Shot Skeleton Action Recognition

arXiv:2604.09063v2 Announce Type: replace Abstract: Human action recognition is pivotal in computer vision, with applications ranging from surveillance to human-robot interaction. Despite the effectiveness of supervised skeleton-based methods, their reliance on exhaustive annotat…

报道来源 [1]

Frequency-Enhanced Diffusion Models: Curriculum-Guided Semantic Alignment for Zero-Shot Skeleton Action Recognition

相关实体

相关话题