来自香港中文大学(深圳)、深圳技术大学和腾讯的研究人员推出了 GameCraft-Bench,这是一个旨在评估 AI 生成完整可玩游戏能力的新基准。与以往侧重于静态代码或简单网页游戏的基准不同,GameCraft-Bench 利用 Godot 4 引擎来评估端到端的游戏开发,包括脚本编写、场景配置和资源集成。该基准包含一个多模态模型来评估生成游戏的动态交互和视觉反馈,结果显示即使是顶级 AI 模型在生成复杂交互系统方面也面临困难,平均得分低于 50%。 AI
影响 凸显了当前 AI 在创建复杂、交互式系统方面的显著局限性,表明需要超越基础代码生成的进步。
排序理由 推出新的 AI 游戏生成基准。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →