研究人员推出了3DCodeBench,这是一个旨在评估视觉语言模型(VLMs)通过代码生成程序化3D模型能力的基准。该基准包含一个多模态提示和相应的程序化代码数据集,以及一个名为3DCodeArena的人类偏好排名平台。评估显示,VLMs经常在API不匹配和几何不一致方面遇到困难,尽管随着推理和精炼能力的提高,性能有所改善。 AI
影响 该基准可以加速能够进行复杂3D内容创作的AI代理的开发,影响游戏开发和虚拟环境。
排序理由 该集群描述了一个用于评估AI模型的新学术基准和数据集。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →