PulseAugur
实时 13:51:26
实体 MMBench2

MMBench2

PulseAugur coverage of MMBench2 — every cluster mentioning MMBench2 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_111520 ·

    新研究详细介绍了世界模型中可预测且可预防的幻觉 · 跟踪了 4 个来源

    研究人员开发了一种预测和预防生成式世界模型中幻觉的方法,这些幻觉通常发生在模型在状态-动作空间的低覆盖区域偏离真实动态时。他们引入了 MMBench2,这是一个大型数据集和一个 3.5 亿参数的模型,并识别了三种幻觉模式:感知幻觉、动作边缘化幻觉和场景发散幻觉。所提出的信号可以检测这些故障,并用于指导数据收集以进行有效微调,从而能够以最少的实际轨迹适应新环境。