实体 Xuefeng Wei

Xuefeng Wei

PulseAugur coverage of Xuefeng Wei — every cluster mentioning Xuefeng Wei across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_51319 · May 26 · 04:00

新基准测试人工智能艺术理解能力，揭示显著差距

研究人员开发了CArtBench，这是一个旨在评估视觉语言模型（VLMs）在中国艺术理解能力的新基准。该基准包含基于证据的推理、结构化鉴赏、重新解读和真实性辨别等任务。对九个VLMs的初步测试显示出显著的局限性，特别是在需要深度推理、风格推断和区分真实艺术品等任务上，表明当前模型能力与专家级艺术鉴赏水平之间存在差距。