NTU RGB+D 120: A Large-Scale Benchmark for 3D Human Activity Understanding
PulseAugur coverage of NTU RGB+D 120: A Large-Scale Benchmark for 3D Human Activity Understanding — every cluster mentioning NTU RGB+D 120: A Large-Scale Benchmark for 3D Human Activity Understanding across labs, papers, and developer communities, ranked by signal.
-
新方法利用多视角运动和文本改进零样本动作识别
研究人员开发了一种新的零样本动作识别方法,提高了对领域变化的鲁棒性。该方法结合了来自多个摄像机视点的运动数据和动作的文本描述。这种面向方向的系统增强了对新颖动作-运动组合的泛化能力,在多个基准测试中表现优于现有的最先进方法。
-
Diffusion models enhanced for zero-shot skeleton action recognition
Researchers have developed a new method called Frequency-Aware Diffusion for Skeleton-Text Matching (FDSM) to improve zero-shot skeleton action recognition. This approach addresses the spectral bias in diffusion models …
-
新的对比学习方法改进了基于骨架的动作定位
研究人员开发了一种名为骨架-片段对比学习(Skeleton-Snippet Contrastive Learning)的新型自监督预训练方法,用于改进基于骨架数据的时序动作定位。该方法使用片段判别任务来学习区分相邻帧的特征,这对于识别动作边界至关重要。该方法还包含一个U型模块来融合中间特征,提高帧级定位的分辨率。实验结果表明,在BABEL数据集上性能有所提升,并在PKUMMD数据集上取得了最先进的迁移学习结果。