研究人员开发了WiserUI-Bench,一个旨在评估多模态大语言模型(MLLMs)对用户界面(UI)设计对用户行为影响理解程度的新基准测试。该基准测试使用了来自行业A/B测试的300对真实UI图像,包括专家对某些设计为何更有效的解读。初步实验表明,当前的MLLMs对UI/UX设计如何影响用户行为的理解有限。 AI
影响 该基准测试有望推动MLLM朝着更细致地理解用户交互和设计原则的方向发展。
排序理由 该集群包含一篇介绍新AI模型评估基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →