中文(ZH) GAIR Paper 107｜高校联合腾讯发布 GameCraft-Bench：AI已能端到端开发游戏，Claude Opus 四成达到可玩水平

AI 游戏生成基准揭示顶级模型在创建可玩游戏方面仍遇挑战

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-26 03:36

来自香港中文大学（深圳）、深圳技术大学和腾讯的研究人员推出了 GameCraft-Bench，这是一个旨在评估 AI 生成完整可玩游戏能力的新基准。与以往侧重于静态代码或简单网页游戏的基准不同，GameCraft-Bench 利用 Godot 4 引擎来评估端到端的游戏开发，包括脚本编写、场景配置和资源集成。该基准包含一个多模态模型来评估生成游戏的动态交互和视觉反馈，结果显示即使是顶级 AI 模型在生成复杂交互系统方面也面临困难，平均得分低于 50%。 AI

影响凸显了当前 AI 在创建复杂、交互式系统方面的显著局限性，表明需要超越基础代码生成的进步。

排序理由推出新的 AI 游戏生成基准。 [lever_c_demoted from research: ic=1 ai=1.0]

在雷峰网 (Leiphone) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

雷峰网 (Leiphone) TIER_1 中文(ZH) · 2026-06-26 03:36

GAIR论文107 | 高校与腾讯联合发布GameCraft-Bench：AI现已实现端到端游戏开发，Claude Opus达到40%可玩水平

<section style="text-align: center; margin: 0px 16px; line-height: 1.75em; display: block;"><img class="rich_pages wxw-img" src="https://static.leiphone.com/uploads/new/images/20260626/6a3df340366e7.jpg?imageMogr2/quality/90" style="width: 100%; display: inline-block; text-align:…

报道来源 [1]

GAIR论文107 | 高校与腾讯联合发布GameCraft-Bench：AI现已实现端到端游戏开发，Claude Opus达到40%可玩水平

相关实体

相关话题