English(EN) Do MLLMs Capture How Interfaces Guide User Behavior? A Benchmark for Multimodal UI/UX Design Understanding

新基准测试LLM对UI/UX设计影响的理解能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-05 04:00

研究人员开发了WiserUI-Bench，一个旨在评估多模态大语言模型（MLLMs）对用户界面（UI）设计对用户行为影响理解程度的新基准测试。该基准测试使用了来自行业A/B测试的300对真实UI图像，包括专家对某些设计为何更有效的解读。初步实验表明，当前的MLLMs对UI/UX设计如何影响用户行为的理解有限。 AI

影响该基准测试有望推动MLLM朝着更细致地理解用户交互和设计原则的方向发展。

排序理由该集群包含一篇介绍新AI模型评估基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Jaehyun Jeon, Min Soo Kim, Jang Han Yoon, Sumin Shim, Yejin Choi, Hanbin Kim, Dae Hyun Kim, Youngjae Yu · 2026-06-05 04:00

多模态大语言模型能捕捉界面如何引导用户行为吗？一个用于理解多模态UI/UX设计的基准测试

arXiv:2505.05026v5 Announce Type: replace Abstract: User interface (UI) design goes beyond visuals to shape user experience (UX), underscoring the shift toward UI/UX as a unified concept. While recent studies have explored UI evaluation using Multimodal Large Language Models (MLL…

报道来源 [1]

多模态大语言模型能捕捉界面如何引导用户行为吗？一个用于理解多模态UI/UX设计的基准测试

相关实体

相关话题