研究人员开发了一种用于短期人类姿态预测的轻量级预测世界模型,将面部表情衍生的情感嵌入作为辅助条件信号。该自回归模型使用两层 LSTM 架构执行 15 步滚动姿态预测。在姿态-情感视频数据集上的实验表明,虽然简单的多模态融合并未始终提高准确性,但归一化门控融合显著增强了情感驱动运动序列的性能。 AI
影响 引入了一种将情感线索纳入人类姿态预测的新颖方法,有可能改善人机交互和辅助技术。
排序理由 关于使用多模态融合进行人类姿态预测新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →