PulseAugur
实时 10:27:03
中文(ZH) GAIR Paper 107|高校联合腾讯发布 GameCraft-Bench:AI已能端到端开发游戏,Claude Opus 四成达到可玩水平

AI 游戏生成基准揭示顶级模型在创建可玩游戏方面仍遇挑战

来自香港中文大学(深圳)、深圳技术大学和腾讯的研究人员推出了 GameCraft-Bench,这是一个旨在评估 AI 生成完整可玩游戏能力的新基准。与以往侧重于静态代码或简单网页游戏的基准不同,GameCraft-Bench 利用 Godot 4 引擎来评估端到端的游戏开发,包括脚本编写、场景配置和资源集成。该基准包含一个多模态模型来评估生成游戏的动态交互和视觉反馈,结果显示即使是顶级 AI 模型在生成复杂交互系统方面也面临困难,平均得分低于 50%。 AI

影响 凸显了当前 AI 在创建复杂、交互式系统方面的显著局限性,表明需要超越基础代码生成的进步。

排序理由 推出新的 AI 游戏生成基准。 [lever_c_demoted from research: ic=1 ai=1.0]

在 雷峰网 (Leiphone) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AI 游戏生成基准揭示顶级模型在创建可玩游戏方面仍遇挑战

报道来源 [1]

  1. 雷峰网 (Leiphone) TIER_1 中文(ZH) ·

    GAIR论文107 | 高校与腾讯联合发布GameCraft-Bench:AI现已实现端到端游戏开发,Claude Opus达到40%可玩水平

    <section style="text-align: center; margin: 0px 16px; line-height: 1.75em; display: block;"><img class="rich_pages wxw-img" src="https://static.leiphone.com/uploads/new/images/20260626/6a3df340366e7.jpg?imageMogr2/quality/90" style="width: 100%; display: inline-block; text-align:…