研究人员推出了Ego-METAS,一个专为以自我为中心、多模态、能效时间动作分割设计的新基准。该基准利用来自三个数据集的100多小时以自我为中心的视频数据,集成了RGB、音频、注视、IMU和黑白摄像头等五种传感器模态。该任务要求模型在严格的能源预算内动态选择激活哪些传感器,解决了具身智能体能源感知这一探索不足的领域。初步评估表明,最优传感器路由高度依赖于具体场景,并且当前的策略学习方法在连续、未修剪的环境中存在困难,尽管即使是简单的动态模态融合对于平衡准确性和能源限制也至关重要。 AI
影响 为具身AI中开发注重能耗的感知系统树立了新标准,这对于实际的机器人应用至关重要。
排序理由 该集群包含一篇研究论文,介绍了一个特定AI任务的新基准和数据集。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →