PulseAugur
实时 13:51:25
实体 MM-CreativityBench

MM-CreativityBench

PulseAugur coverage of MM-CreativityBench — every cluster mentioning MM-CreativityBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_53650 ·

    New Benchmark Tests LMMs' Creative Physical Intelligence

    研究人员开发了MM-CreativityBench,这是一个旨在评估大型多模态模型(LMM)的创造性物理智能的新基准。该基准侧重于LMM在视觉丰富、物理约束环境中的识别和再利用对象的能力,这是当前模型通常缺乏的一项能力。为了解决这个问题,研究人员提出了一种使用直接偏好优化(Direct Preference Optimization)的具身对齐方法,鼓励模型依赖视觉证据并减少幻觉,从而提高实体选择和具身推理能力。