HuM-Eval 框架通过粗粒度到细粒度方法改进以人为中心的视频评估

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 08:27

研究人员推出 HuM-Eval，一个旨在更好地评估生成视频中人类运动质量的新框架。现有指标常常忽略细微的人类细节，导致评估结果与人类偏好不符。HuM-Eval 采用粗粒度到细粒度的方法，首先使用视觉语言模型进行总体评估，然后分析 2D 姿势的解剖学准确性和 3D 运动的稳定性。该方法与人类判断的相关性达到了 58.2%，超过了现有基准。 AI

影响引入了一种更准确的评估生成视频中人类运动的方法，可能指导未来文本到视频模型的改进。

排序理由介绍视频生成模型新评估框架的学术论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-04-28 08:27

HuM-Eval：面向以人为本的视频评估的粗粒度到细粒度框架

Video generation models have developed rapidly in recent years, where generating natural human motion plays a pivotal role. However, accurately evaluating the quality of generated human motion video remains a significant challenge. Existing evaluation metrics primarily focus on g…

报道来源 [1]

HuM-Eval：面向以人为本的视频评估的粗粒度到细粒度框架

相关话题