PulseAugur
实时 12:11:52
实体 MM-EPC

MM-EPC

PulseAugur coverage of MM-EPC — every cluster mentioning MM-EPC across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_93585 ·

    AI智能体在多模态评估中表现出放大偏见

    一篇新的研究论文探讨了AI智能体中的“评估者偏好崩溃”(EPC)现象,发现多模态设置显著放大了这种偏见。在使用GPT-4o评估DeepSeek-chat时,单一策略占据了48.4%的权重,比纯文本评估增加了3.2倍。研究还发现了“跨模态传染”,即在一个模态中学到的偏好会转移到另一个模态并对其产生负面影响。自评估几乎不受传染影响,而跨模型评估被确定为主要风险因素。