PulseAugur
实时 16:55:14
实体 PIVOTSBench

PIVOTSBench

PulseAugur coverage of PIVOTSBench — every cluster mentioning PIVOTSBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_105087 ·

    新的PIVOTSBench基准评估MLLM的人际关系推理能力

    研究人员推出了PIVOTSBench,这是一个旨在评估多模态大语言模型(MLLM)理解和推理人际关系能力的新基准。该基准源自Social-IQ 2.0和YouTube数据,包含评估模型预测关系维度和识别关键视觉线索能力的任务。评估涵盖了专有和开源的MLLM,研究探讨了视觉模态和对话上下文的影响。