English(EN) CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

CreativeBench 基准测试评估和增强机器创造力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-12 04:00

研究人员推出了 CreativeBench，这是一个旨在评估和增强机器创造力的新基准测试，特别是在代码生成方面。该基准测试利用认知框架，并包含两个子集 CreativeBench-Combo 和 CreativeBench-Explore，以评估组合创造力和探索性创造力。一个关键发现是，虽然模型规模的扩大可以提高组合创造力，但可能导致探索性创造力的收益递减，并倾向于“通过规模化收敛”，使模型更正确但发散性更差。为解决此问题，该论文提出 EvoRePE，一种通过整合进化搜索模式来提高机器创造力的策略。 AI

影响引入了一个评估机器创造力的新基准测试，有可能指导未来模型开发朝着更具发散性和探索性的能力发展。

排序理由该集群包含一篇介绍机器创造力新基准测试和评估方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang · 2026-06-12 04:00

CreativeBench：通过自演化挑战进行基准测试和增强机器创造力

arXiv:2603.11863v2 Announce Type: replace Abstract: The saturation of high-quality pre-training data has shifted research focus toward evolutionary systems capable of continuously generating novel artifacts, leading to the success of AlphaEvolve. However, the progress of such sys…

报道来源 [1]

CreativeBench：通过自演化挑战进行基准测试和增强机器创造力

相关实体

相关话题